rippertnt commited on Jan 8

Commit

d170e54

verified ·

1 Parent(s): 20d1e1e

Upload 146 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +42 -0
FreeVC_ov/cmodel_ir.bin +3 -0
FreeVC_ov/cmodel_ir.xml +0 -0
FreeVC_ov/net_gir.bin +3 -0
FreeVC_ov/net_gir.xml +0 -0
FreeVC_ov/smodelir.bin +3 -0
FreeVC_ov/smodelir.xml +1241 -0
Qwen3-Embedding-0.6B-ov-int4/added_tokens.json +28 -0
Qwen3-Embedding-0.6B-ov-int4/chat_template.jinja +85 -0
Qwen3-Embedding-0.6B-ov-int4/config.json +60 -0
Qwen3-Embedding-0.6B-ov-int4/merges.txt +0 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/10398472748164076480.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/11841033957157841238.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/13100948868569734950.cl_cache +0 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/14256774865286315154.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/15972597138584836711.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/17015111877664402134.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/18358898440656323975.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/18425769849181688742.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/2084631378233982642.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/2200953350652739583.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/2467060138956266788.blob +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/3006077353902421111.cl_cache +0 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/4187937748300361869.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/514085034797992975.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/6367819844101748113.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/6380654293821853377.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/6417489891108773540.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/8227443482036439551.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/8233817952741756344.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/8855579903425484800.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/9546625216876219351.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/model_cache/9683605224545850666.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_config.json +46 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_detokenizer.bin +3 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_detokenizer.xml +219 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_model.bin +3 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_model.xml +0 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_tokenizer.bin +3 -0
Qwen3-Embedding-0.6B-ov-int4/openvino_tokenizer.xml +799 -0
Qwen3-Embedding-0.6B-ov-int4/special_tokens_map.json +31 -0
Qwen3-Embedding-0.6B-ov-int4/tokenizer.json +3 -0
Qwen3-Embedding-0.6B-ov-int4/tokenizer_config.json +239 -0
Qwen3-Embedding-0.6B-ov-int4/vocab.json +0 -0
Qwen3-Embedding-0.6B-ov-int8/added_tokens.json +28 -0
Qwen3-Embedding-0.6B-ov-int8/chat_template.jinja +85 -0
Qwen3-Embedding-0.6B-ov-int8/config.json +60 -0
Qwen3-Embedding-0.6B-ov-int8/merges.txt +0 -0
Qwen3-Embedding-0.6B-ov-int8/model_cache/10398472748164076480.cl_cache +3 -0
Qwen3-Embedding-0.6B-ov-int8/model_cache/12113472825542766259.cl_cache +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,45 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/10398472748164076480.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/11841033957157841238.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/14256774865286315154.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/15972597138584836711.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/17015111877664402134.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/18358898440656323975.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/18425769849181688742.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/2084631378233982642.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/2200953350652739583.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/2467060138956266788.blob filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/4187937748300361869.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/514085034797992975.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/6367819844101748113.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/6380654293821853377.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/6417489891108773540.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/8227443482036439551.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/8233817952741756344.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/8855579903425484800.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/9546625216876219351.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/model_cache/9683605224545850666.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int4/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/10398472748164076480.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/12113472825542766259.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/13904763665985950121.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/14228004042234774058.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/15452446039601008211.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/15972597138584836711.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/17015111877664402134.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/17917053609886349368.blob filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/18358898440656323975.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/1897978825296495813.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/2084631378233982642.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/3535274234211186810.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/3767622921309506184.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/4083341330400695577.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/7317836480131138323.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/8855579903425484800.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/model_cache/9546625216876219351.cl_cache filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-0.6B-ov-int8/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Reranker-0.6B-ov-fp16/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Reranker-0.6B-ov-int4/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Reranker-0.6B-ov-int8/tokenizer.json filter=lfs diff=lfs merge=lfs -text

FreeVC_ov/cmodel_ir.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a13c4b44223f28d5345c7094fa15e78ee6a71065dddae15cd8366a0277548c75
+size 630904264

FreeVC_ov/cmodel_ir.xml ADDED Viewed

The diff for this file is too large to render. See raw diff

FreeVC_ov/net_gir.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd04b8833ecebd5cc5fab4b8541c7523b295154819e0180e924e9cfffd540ee4
+size 60905382

FreeVC_ov/net_gir.xml ADDED Viewed

The diff for this file is too large to render. See raw diff

FreeVC_ov/smodelir.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8b957d216cc4d2d167403b7cfb6705a76ef04d84a25d339718c0571497101f2a
+size 2841174

FreeVC_ov/smodelir.xml ADDED Viewed

	@@ -0,0 +1,1241 @@

+<?xml version="1.0"?>
+<net name="Model4" version="11">
+	<layers>
+		<layer id="0" name="mels" type="Parameter" version="opset1">
+			<data shape="?,?,?" element_type="f32" />
+			<output>
+				<port id="0" precision="FP32" names="mels">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="__module.lstm/aten::zeros/Convert_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="" offset="0" size="2" />
+			<output>
+				<port id="0" precision="FP16" />
+			</output>
+		</layer>
+		<layer id="2" name="__module.lstm/aten::zeros/Convert" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16" />
+			</input>
+			<output>
+				<port id="1" precision="FP32" />
+			</output>
+		</layer>
+		<layer id="3" name="Constant_333313" type="Const" version="opset1">
+			<data element_type="i64" shape="1" offset="2" size="8" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="ShapeOf_335713" type="ShapeOf" version="opset3">
+			<data output_type="i64" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="5" name="Constant_335714" type="Const" version="opset1">
+			<data element_type="i64" shape="1" offset="10" size="8" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="6" name="Constant_335715" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="10" size="8" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="7" name="Gather_335716" type="Gather" version="opset8">
+			<data batch_dims="0" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>1</dim>
+				</port>
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I64" names="39">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="8" name="Constant_333314" type="Const" version="opset1">
+			<data element_type="i64" shape="1" offset="18" size="8" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="__module.lstm/prim::ListConstruct" type="Concat" version="opset1">
+			<data axis="0" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>1</dim>
+				</port>
+				<port id="2" precision="I64">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="10" name="__module.lstm/aten::zeros/Broadcast" type="Broadcast" version="opset3">
+			<data mode="numpy" />
+			<input>
+				<port id="0" precision="FP32" />
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="41,43,hx,hx.1">
+					<dim>3</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="11" name="Constant_333355" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="26" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="12" name="__module.lstm/aten::lstm/Split" type="Split" version="opset1">
+			<data num_splits="3" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>3</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="3" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="4" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="13" name="Constant_335522" type="Const" version="opset1">
+			<data element_type="i64" shape="3" offset="30" size="24" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="14" name="__module.lstm/aten::lstm/Transpose" type="Reshape" version="opset1">
+			<data special_zero="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="15" name="Convert_335721" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="16" name="Constant_333358" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="54" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="17" name="Constant_333379" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="26" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="18" name="__module.lstm/aten::lstm/Gather" type="Gather" version="opset8">
+			<data batch_dims="0" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>3</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="19" name="Convert_335722" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="20" name="__module.lstm/aten::lstm/Broadcast" type="Broadcast" version="opset3">
+			<data mode="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="21" name="__module.lstm/aten::lstm/Unsqueeze_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 40" offset="58" size="81920" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>40</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="22" name="__module.lstm/aten::lstm/Unsqueeze" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>40</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>40</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="23" name="__module.lstm/aten::lstm/Unsqueeze_1_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 256" offset="81978" size="524288" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="24" name="__module.lstm/aten::lstm/Unsqueeze_1" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="25" name="__module.lstm/aten::lstm/Unsqueeze_2_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024" offset="606266" size="2048" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="26" name="__module.lstm/aten::lstm/Unsqueeze_2" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="27" name="__module.lstm/aten::lstm/LSTMSequence" type="LSTMSequence" version="opset5">
+			<data direction="forward" hidden_size="256" activations="sigmoid, tanh, tanh" activations_alpha="" activations_beta="" clip="0" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>40</dim>
+				</port>
+				<port id="5" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+				<port id="6" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="8" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="9" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="28" name="Constant_333357" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="54" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="29" name="__module.lstm/aten::lstm/Squeeze" type="Squeeze" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="30" name="Constant_335524" type="Const" version="opset1">
+			<data element_type="i64" shape="3" offset="30" size="24" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="31" name="__module.lstm/aten::lstm/Transpose_2" type="Reshape" version="opset1">
+			<data special_zero="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="32" name="__module.lstm/aten::lstm/Split_1" type="Split" version="opset1">
+			<data num_splits="3" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>3</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="3" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="4" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="33" name="Constant_335526" type="Const" version="opset1">
+			<data element_type="i64" shape="3" offset="30" size="24" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="34" name="__module.lstm/aten::lstm/Transpose_3" type="Reshape" version="opset1">
+			<data special_zero="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="35" name="__module.lstm/aten::lstm/Unsqueeze_3_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 256" offset="608314" size="524288" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="36" name="__module.lstm/aten::lstm/Unsqueeze_3" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="37" name="__module.lstm/aten::lstm/Unsqueeze_4_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 256" offset="1132602" size="524288" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="38" name="__module.lstm/aten::lstm/Unsqueeze_4" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="39" name="__module.lstm/aten::lstm/Unsqueeze_5_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024" offset="1656890" size="2048" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="40" name="__module.lstm/aten::lstm/Unsqueeze_5" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="41" name="__module.lstm/aten::lstm/LSTMSequence_1" type="LSTMSequence" version="opset5">
+			<data direction="forward" hidden_size="256" activations="sigmoid, tanh, tanh" activations_alpha="" activations_beta="" clip="0" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+				<port id="5" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+				<port id="6" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="8" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="9" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="42" name="__module.lstm/aten::lstm/Squeeze_1" type="Squeeze" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="43" name="Constant_335528" type="Const" version="opset1">
+			<data element_type="i64" shape="3" offset="30" size="24" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="44" name="__module.lstm/aten::lstm/Transpose_4" type="Reshape" version="opset1">
+			<data special_zero="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="45" name="Constant_335530" type="Const" version="opset1">
+			<data element_type="i64" shape="3" offset="30" size="24" />
+			<rt_info>
+				<attribute name="precise" version="0" />
+			</rt_info>
+			<output>
+				<port id="0" precision="I64">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="46" name="__module.lstm/aten::lstm/Transpose_5" type="Reshape" version="opset1">
+			<data special_zero="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="47" name="__module.lstm/aten::lstm/Unsqueeze_6_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 256" offset="1658938" size="524288" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="48" name="__module.lstm/aten::lstm/Unsqueeze_6" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="49" name="__module.lstm/aten::lstm/Unsqueeze_7_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024, 256" offset="2183226" size="524288" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="50" name="__module.lstm/aten::lstm/Unsqueeze_7" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="51" name="__module.lstm/aten::lstm/Unsqueeze_8_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 1024" offset="2707514" size="2048" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="52" name="__module.lstm/aten::lstm/Unsqueeze_8" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="53" name="__module.lstm/aten::lstm/LSTMSequence_2" type="LSTMSequence" version="opset5">
+			<data direction="forward" hidden_size="256" activations="sigmoid, tanh, tanh" activations_alpha="" activations_beta="" clip="0" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+				<port id="5" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+					<dim>256</dim>
+				</port>
+				<port id="6" precision="FP32">
+					<dim>1</dim>
+					<dim>1024</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="8" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="9" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="54" name="__module.lstm/aten::lstm/Concat" type="Concat" version="opset1">
+			<data axis="1" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="FP32">
+					<dim>-1</dim>
+					<dim>3</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="55" name="Constant_333359" type="Const" version="opset1">
+			<data element_type="i32" shape="3" offset="2709562" size="12" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="56" name="__module.lstm/aten::lstm/Transpose_6" type="Transpose" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>3</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="47,hidden">
+					<dim>3</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="57" name="7" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="2709574" size="8" />
+			<output>
+				<port id="0" precision="I64" names="7" />
+			</output>
+		</layer>
+		<layer id="58" name="6" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="10" size="8" />
+			<output>
+				<port id="0" precision="I64" names="6" />
+			</output>
+		</layer>
+		<layer id="59" name="aten::select/Gather" type="Gather" version="opset8">
+			<data batch_dims="0" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>3</dim>
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="FP32" names="8,input.1">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="60" name="self.linear.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="256, 256" offset="2709582" size="131072" />
+			<output>
+				<port id="0" precision="FP16" names="self.linear.weight">
+					<dim>256</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="61" name="self.linear.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>256</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>256</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="62" name="__module.linear/aten::linear/MatMul" type="MatMul" version="opset1">
+			<data transpose_a="false" transpose_b="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>256</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="63" name="Constant_335692_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 256" offset="2840654" size="512" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="64" name="Constant_335692" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="65" name="__module.linear/aten::linear/Add" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="51,input.3">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="66" name="__module.relu/aten::relu/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="52,input">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="67" name="Constant_333456" type="Const" version="opset1">
+			<data element_type="i64" shape="1" offset="2841166" size="8" />
+			<output>
+				<port id="0" precision="I64" names="13">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="68" name="aten::linalg_vector_norm/ReduceL2" type="ReduceL2" version="opset4">
+			<data keep_dims="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="I64">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="16">
+					<dim>-1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="69" name="aten::div/Divide" type="Divide" version="opset1">
+			<data auto_broadcast="numpy" m_pythondiv="true" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>-1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="70" name="Result_333464" type="Result" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>-1</dim>
+					<dim>256</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="4" to-port="0" />
+		<edge from-layer="0" from-port="0" to-layer="27" to-port="0" />
+		<edge from-layer="1" from-port="0" to-layer="2" to-port="0" />
+		<edge from-layer="2" from-port="1" to-layer="10" to-port="0" />
+		<edge from-layer="3" from-port="0" to-layer="9" to-port="0" />
+		<edge from-layer="4" from-port="1" to-layer="7" to-port="0" />
+		<edge from-layer="4" from-port="1" to-layer="15" to-port="0" />
+		<edge from-layer="5" from-port="0" to-layer="7" to-port="1" />
+		<edge from-layer="6" from-port="0" to-layer="7" to-port="2" />
+		<edge from-layer="7" from-port="3" to-layer="19" to-port="0" />
+		<edge from-layer="7" from-port="3" to-layer="9" to-port="1" />
+		<edge from-layer="8" from-port="0" to-layer="9" to-port="2" />
+		<edge from-layer="9" from-port="3" to-layer="10" to-port="1" />
+		<edge from-layer="10" from-port="2" to-layer="12" to-port="0" />
+		<edge from-layer="10" from-port="2" to-layer="32" to-port="0" />
+		<edge from-layer="11" from-port="0" to-layer="12" to-port="1" />
+		<edge from-layer="11" from-port="0" to-layer="32" to-port="1" />
+		<edge from-layer="12" from-port="3" to-layer="31" to-port="0" />
+		<edge from-layer="12" from-port="2" to-layer="14" to-port="0" />
+		<edge from-layer="12" from-port="4" to-layer="44" to-port="0" />
+		<edge from-layer="13" from-port="0" to-layer="14" to-port="1" />
+		<edge from-layer="14" from-port="2" to-layer="27" to-port="1" />
+		<edge from-layer="14" from-port="2" to-layer="27" to-port="2" />
+		<edge from-layer="15" from-port="1" to-layer="18" to-port="0" />
+		<edge from-layer="16" from-port="0" to-layer="18" to-port="1" />
+		<edge from-layer="17" from-port="0" to-layer="18" to-port="2" />
+		<edge from-layer="18" from-port="3" to-layer="20" to-port="0" />
+		<edge from-layer="19" from-port="1" to-layer="20" to-port="1" />
+		<edge from-layer="20" from-port="2" to-layer="41" to-port="3" />
+		<edge from-layer="20" from-port="2" to-layer="27" to-port="3" />
+		<edge from-layer="20" from-port="2" to-layer="53" to-port="3" />
+		<edge from-layer="21" from-port="0" to-layer="22" to-port="0" />
+		<edge from-layer="22" from-port="1" to-layer="27" to-port="4" />
+		<edge from-layer="23" from-port="0" to-layer="24" to-port="0" />
+		<edge from-layer="24" from-port="1" to-layer="27" to-port="5" />
+		<edge from-layer="25" from-port="0" to-layer="26" to-port="0" />
+		<edge from-layer="26" from-port="1" to-layer="27" to-port="6" />
+		<edge from-layer="27" from-port="8" to-layer="54" to-port="0" />
+		<edge from-layer="27" from-port="7" to-layer="29" to-port="0" />
+		<edge from-layer="28" from-port="0" to-layer="29" to-port="1" />
+		<edge from-layer="28" from-port="0" to-layer="42" to-port="1" />
+		<edge from-layer="29" from-port="2" to-layer="41" to-port="0" />
+		<edge from-layer="30" from-port="0" to-layer="31" to-port="1" />
+		<edge from-layer="31" from-port="2" to-layer="41" to-port="1" />
+		<edge from-layer="32" from-port="4" to-layer="46" to-port="0" />
+		<edge from-layer="32" from-port="3" to-layer="34" to-port="0" />
+		<edge from-layer="33" from-port="0" to-layer="34" to-port="1" />
+		<edge from-layer="34" from-port="2" to-layer="41" to-port="2" />
+		<edge from-layer="35" from-port="0" to-layer="36" to-port="0" />
+		<edge from-layer="36" from-port="1" to-layer="41" to-port="4" />
+		<edge from-layer="37" from-port="0" to-layer="38" to-port="0" />
+		<edge from-layer="38" from-port="1" to-layer="41" to-port="5" />
+		<edge from-layer="39" from-port="0" to-layer="40" to-port="0" />
+		<edge from-layer="40" from-port="1" to-layer="41" to-port="6" />
+		<edge from-layer="41" from-port="7" to-layer="42" to-port="0" />
+		<edge from-layer="41" from-port="8" to-layer="54" to-port="1" />
+		<edge from-layer="42" from-port="2" to-layer="53" to-port="0" />
+		<edge from-layer="43" from-port="0" to-layer="44" to-port="1" />
+		<edge from-layer="44" from-port="2" to-layer="53" to-port="1" />
+		<edge from-layer="45" from-port="0" to-layer="46" to-port="1" />
+		<edge from-layer="46" from-port="2" to-layer="53" to-port="2" />
+		<edge from-layer="47" from-port="0" to-layer="48" to-port="0" />
+		<edge from-layer="48" from-port="1" to-layer="53" to-port="4" />
+		<edge from-layer="49" from-port="0" to-layer="50" to-port="0" />
+		<edge from-layer="50" from-port="1" to-layer="53" to-port="5" />
+		<edge from-layer="51" from-port="0" to-layer="52" to-port="0" />
+		<edge from-layer="52" from-port="1" to-layer="53" to-port="6" />
+		<edge from-layer="53" from-port="8" to-layer="54" to-port="2" />
+		<edge from-layer="54" from-port="3" to-layer="56" to-port="0" />
+		<edge from-layer="55" from-port="0" to-layer="56" to-port="1" />
+		<edge from-layer="56" from-port="2" to-layer="59" to-port="0" />
+		<edge from-layer="57" from-port="0" to-layer="59" to-port="1" />
+		<edge from-layer="58" from-port="0" to-layer="59" to-port="2" />
+		<edge from-layer="59" from-port="3" to-layer="62" to-port="0" />
+		<edge from-layer="60" from-port="0" to-layer="61" to-port="0" />
+		<edge from-layer="61" from-port="1" to-layer="62" to-port="1" />
+		<edge from-layer="62" from-port="2" to-layer="65" to-port="0" />
+		<edge from-layer="63" from-port="0" to-layer="64" to-port="0" />
+		<edge from-layer="64" from-port="1" to-layer="65" to-port="1" />
+		<edge from-layer="65" from-port="2" to-layer="66" to-port="0" />
+		<edge from-layer="66" from-port="1" to-layer="68" to-port="0" />
+		<edge from-layer="66" from-port="1" to-layer="69" to-port="0" />
+		<edge from-layer="67" from-port="0" to-layer="68" to-port="1" />
+		<edge from-layer="68" from-port="2" to-layer="69" to-port="1" />
+		<edge from-layer="69" from-port="2" to-layer="70" to-port="0" />
+	</edges>
+	<rt_info>
+		<Runtime_version value="2025.4.1-20426-82bbf0292c5-releases/2025/4" />
+		<conversion_parameters>
+			<framework value="pytorch" />
+			<is_python_object value="True" />
+		</conversion_parameters>
+	</rt_info>
+</net>

Qwen3-Embedding-0.6B-ov-int4/added_tokens.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "</think>": 151668,
+  "</tool_call>": 151658,
+  "</tool_response>": 151666,
+  "<think>": 151667,
+  "<tool_call>": 151657,
+  "<tool_response>": 151665,
+  "<|box_end|>": 151649,
+  "<|box_start|>": 151648,
+  "<|endoftext|>": 151643,
+  "<|file_sep|>": 151664,
+  "<|fim_middle|>": 151660,
+  "<|fim_pad|>": 151662,
+  "<|fim_prefix|>": 151659,
+  "<|fim_suffix|>": 151661,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644,
+  "<|image_pad|>": 151655,
+  "<|object_ref_end|>": 151647,
+  "<|object_ref_start|>": 151646,
+  "<|quad_end|>": 151651,
+  "<|quad_start|>": 151650,
+  "<|repo_name|>": 151663,
+  "<|video_pad|>": 151656,
+  "<|vision_end|>": 151653,
+  "<|vision_pad|>": 151654,
+  "<|vision_start|>": 151652
+}

Qwen3-Embedding-0.6B-ov-int4/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,85 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0].role == 'system' %}
+        {{- messages[0].content + '\n\n' }}
+    {%- endif %}
+    {{- "# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0].role == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0].content + '<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}
+{%- for message in messages[::-1] %}
+    {%- set index = (messages|length - 1) - loop.index0 %}
+    {%- if ns.multi_step_tool and message.role == "user" and not(message.content.startswith('<tool_response>') and message.content.endswith('</tool_response>')) %}
+        {%- set ns.multi_step_tool = false %}
+        {%- set ns.last_query_index = index %}
+    {%- endif %}
+{%- endfor %}
+{%- for message in messages %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) %}
+        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {%- set content = message.content %}
+        {%- set reasoning_content = '' %}
+        {%- if message.reasoning_content is defined and message.reasoning_content is not none %}
+            {%- set reasoning_content = message.reasoning_content %}
+        {%- else %}
+            {%- if '</think>' in message.content %}
+                {%- set content = message.content.split('</think>')[-1].lstrip('\n') %}
+                {%- set reasoning_content = message.content.split('</think>')[0].rstrip('\n').split('<think>')[-1].lstrip('\n') %}
+            {%- endif %}
+        {%- endif %}
+        {%- if loop.index0 > ns.last_query_index %}
+            {%- if loop.last or (not loop.last and reasoning_content) %}
+                {{- '<|im_start|>' + message.role + '\n<think>\n' + reasoning_content.strip('\n') + '\n</think>\n\n' + content.lstrip('\n') }}
+            {%- else %}
+                {{- '<|im_start|>' + message.role + '\n' + content }}
+            {%- endif %}
+        {%- else %}
+            {{- '<|im_start|>' + message.role + '\n' + content }}
+        {%- endif %}
+        {%- if message.tool_calls %}
+            {%- for tool_call in message.tool_calls %}
+                {%- if (loop.first and content) or (not loop.first) %}
+                    {{- '\n' }}
+                {%- endif %}
+                {%- if tool_call.function %}
+                    {%- set tool_call = tool_call.function %}
+                {%- endif %}
+                {{- '<tool_call>\n{"name": "' }}
+                {{- tool_call.name }}
+                {{- '", "arguments": ' }}
+                {%- if tool_call.arguments is string %}
+                    {{- tool_call.arguments }}
+                {%- else %}
+                    {{- tool_call.arguments | tojson }}
+                {%- endif %}
+                {{- '}\n</tool_call>' }}
+            {%- endfor %}
+        {%- endif %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if loop.first or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- message.content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+    {%- if enable_thinking is defined and enable_thinking is false %}
+        {{- '<think>\n\n</think>\n\n' }}
+    {%- endif %}
+{%- endif %}

Qwen3-Embedding-0.6B-ov-int4/config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "architectures": [
+    "Qwen3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "dtype": "float32",
+  "eos_token_id": 151643,
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_types": [
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 28,
+  "model_type": "qwen3",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 1000000,
+  "sliding_window": null,
+  "tie_word_embeddings": true,
+  "transformers_version": "4.57.3",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151669
+}

Qwen3-Embedding-0.6B-ov-int4/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-0.6B-ov-int4/model_cache/10398472748164076480.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cea6db01e75c76d8eb37b65365b63d200e1ae11d54f2aa98fc0d030563288286
+size 144120

Qwen3-Embedding-0.6B-ov-int4/model_cache/11841033957157841238.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba18121c4cb32a9ff895d34d6b5111f3256f6b20e479b981852f6f0817b84799
+size 196864

Qwen3-Embedding-0.6B-ov-int4/model_cache/13100948868569734950.cl_cache ADDED Viewed

Binary file (2.69 kB). View file

Qwen3-Embedding-0.6B-ov-int4/model_cache/14256774865286315154.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7bf7c69f1b0d4cf0e90c0dbb5c276c2c87a65dcb652c4f924ebb6b6b2f18dae3
+size 202680

Qwen3-Embedding-0.6B-ov-int4/model_cache/15972597138584836711.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d585dce7cabf849f6f0a52f96158ce040a2e7c6408076e94fefbda137b8e1f12
+size 140304

Qwen3-Embedding-0.6B-ov-int4/model_cache/17015111877664402134.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2358c4686d9148d5f9238614998149bc1c4a57bccdc30e52461fad619d3eedc3
+size 144120

Qwen3-Embedding-0.6B-ov-int4/model_cache/18358898440656323975.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45fb211dd0e70a8b269ee10d36b86a282a7cb5474e51433348e5c17c76407392
+size 126216

Qwen3-Embedding-0.6B-ov-int4/model_cache/18425769849181688742.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89842033af13feede454073afef7be45b11f0b1419bfef8db6e277ca84292bff
+size 179656

Qwen3-Embedding-0.6B-ov-int4/model_cache/2084631378233982642.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33de7bc7919011d58cf8cb7f28b4c13b53ba8d5b0bbcf69441c4553326025627
+size 140304

Qwen3-Embedding-0.6B-ov-int4/model_cache/2200953350652739583.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2226cbd37e84f43622a9a84b14fb04abf29da04b15d70afc2ef1e4e1ec60bfcd
+size 212296

Qwen3-Embedding-0.6B-ov-int4/model_cache/2467060138956266788.blob ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76130c2ab64f3c5b3d171c09edd495703fe2fd87cb2934f35b657dff2688d5eb
+size 447155799

Qwen3-Embedding-0.6B-ov-int4/model_cache/3006077353902421111.cl_cache ADDED Viewed

Binary file (38.2 kB). View file

Qwen3-Embedding-0.6B-ov-int4/model_cache/4187937748300361869.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ea0cdf6c13d684f18085a8e1361cf39e913119382b1a67089cc24f7fa69f9354
+size 184912

Qwen3-Embedding-0.6B-ov-int4/model_cache/514085034797992975.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64f722825a5b3a126a7ee63df47b557f21c349dc651e43c10dec0b870984e98e
+size 178624

Qwen3-Embedding-0.6B-ov-int4/model_cache/6367819844101748113.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a711f37f299098d17587e90513954bc09ce6b2b6cdea23f8dc7768a1230b6811
+size 160160

Qwen3-Embedding-0.6B-ov-int4/model_cache/6380654293821853377.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7e52f40efcc8aa1ffcba8a0f16bf2ce481cd2f73ab282701a141c1343058970b
+size 178952

Qwen3-Embedding-0.6B-ov-int4/model_cache/6417489891108773540.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9340776db61a96c28e5f6a15848926eaa5998f9d17a9f26885991c91f4865f3
+size 160040

Qwen3-Embedding-0.6B-ov-int4/model_cache/8227443482036439551.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f027e9c953607f3c8c5caf63c753f72b278372d83ff7ade832540a00058106a
+size 187632

Qwen3-Embedding-0.6B-ov-int4/model_cache/8233817952741756344.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d97e1ff59b3f5317e538db6a9412d578854d37bfc9471e5ed0f8fa8d290add64
+size 176840

Qwen3-Embedding-0.6B-ov-int4/model_cache/8855579903425484800.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2fcf4faf78e75192ce7a673938aa8532a63bd78ffa7dfb2ecc08f765a89d7e3
+size 264552

Qwen3-Embedding-0.6B-ov-int4/model_cache/9546625216876219351.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b415353495ccd5593725f4aaad4a90be7ab03b5c4cdc6cfbc0dd1a3f57f1319
+size 429248

Qwen3-Embedding-0.6B-ov-int4/model_cache/9683605224545850666.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c525e13bfaeab6561d6210f3c0604eb1042068182614b6d987e946ba5da7141
+size 160216

Qwen3-Embedding-0.6B-ov-int4/openvino_config.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "dtype": "int4",
+  "input_info": null,
+  "optimum_version": "2.1.0",
+  "output_attentions": false,
+  "quantization_config": {
+    "dataset": null,
+    "default_config": {
+      "quant_method": "default"
+    },
+    "ignored_scope": null,
+    "num_samples": null,
+    "processor": null,
+    "quantization_configs": {
+      "model": {
+        "all_layers": null,
+        "backup_precision": null,
+        "bits": 4,
+        "dataset": null,
+        "dtype": "int4",
+        "gptq": null,
+        "group_size": null,
+        "group_size_fallback": null,
+        "ignored_scope": {
+          "names": [
+            "__module.layers.27.mlp.up_proj/aten::linear/MatMul",
+            "__module.layers.27.mlp.gate_proj/aten::linear/MatMul"
+          ]
+        },
+        "lora_correction": null,
+        "num_samples": null,
+        "processor": null,
+        "quant_method": "default",
+        "ratio": 0.8,
+        "scale_estimation": null,
+        "sensitivity_metric": null,
+        "statistics_path": null,
+        "sym": false,
+        "tokenizer": "Qwen/Qwen3-Embedding-0.6B"
+      }
+    },
+    "tokenizer": "Qwen/Qwen3-Embedding-0.6B"
+  },
+  "save_onnx_model": false,
+  "transformers_version": "4.57.3"
+}

Qwen3-Embedding-0.6B-ov-int4/openvino_detokenizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d73093f72c80ebcaffb76a192727170ecd3c6a06c4df52df0e76b3f70ad9d7f7
+size 2189717

Qwen3-Embedding-0.6B-ov-int4/openvino_detokenizer.xml ADDED Viewed

	@@ -0,0 +1,219 @@

+<?xml version="1.0"?>
+<net name="detokenizer" version="11">
+	<layers>
+		<layer id="0" name="Parameter_73346" type="Parameter" version="opset1">
+			<data shape="?,?" element_type="i64" />
+			<output>
+				<port id="0" precision="I64" names="Parameter_73346">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="Convert_73545" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="2" name="Constant_73348" type="Const" version="opset1">
+			<data element_type="i32" shape="151669" offset="0" size="606676" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151669</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="3" name="Constant_73350" type="Const" version="opset1">
+			<data element_type="i32" shape="151669" offset="606676" size="606676" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151669</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="Constant_73352" type="Const" version="opset1">
+			<data element_type="u8" shape="976309" offset="1213352" size="976309" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>976309</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="5" name="Slice_73357" type="Const" version="opset1">
+			<data element_type="i32" shape="14" offset="2189661" size="56" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>14</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="6" name="VocabDecoder_73359" type="VocabDecoder" version="extension">
+			<data skip_tokens="" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>151669</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>151669</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>976309</dim>
+				</port>
+				<port id="4" precision="I32">
+					<dim>14</dim>
+				</port>
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="7" name="FuzeRagged_73360" type="FuzeRagged" version="extension">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="4" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="8" name="UTF8Validate_73361" type="UTF8Validate" version="extension">
+			<data replace_mode="true" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="StringTensorPack_73362" type="StringTensorPack" version="opset15">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="STRING" names="Result_73363,string_output">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="10" name="Result_73363" type="Result" version="opset1" output_names="Result_73363,string_output">
+			<input>
+				<port id="0" precision="STRING">
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="1" to-port="0" />
+		<edge from-layer="1" from-port="1" to-layer="6" to-port="0" />
+		<edge from-layer="2" from-port="0" to-layer="6" to-port="1" />
+		<edge from-layer="3" from-port="0" to-layer="6" to-port="2" />
+		<edge from-layer="4" from-port="0" to-layer="6" to-port="3" />
+		<edge from-layer="5" from-port="0" to-layer="6" to-port="4" />
+		<edge from-layer="6" from-port="7" to-layer="7" to-port="2" />
+		<edge from-layer="6" from-port="9" to-layer="8" to-port="2" />
+		<edge from-layer="6" from-port="8" to-layer="7" to-port="3" />
+		<edge from-layer="6" from-port="6" to-layer="7" to-port="1" />
+		<edge from-layer="6" from-port="5" to-layer="7" to-port="0" />
+		<edge from-layer="7" from-port="4" to-layer="8" to-port="0" />
+		<edge from-layer="7" from-port="5" to-layer="8" to-port="1" />
+		<edge from-layer="8" from-port="3" to-layer="9" to-port="0" />
+		<edge from-layer="8" from-port="4" to-layer="9" to-port="1" />
+		<edge from-layer="8" from-port="5" to-layer="9" to-port="2" />
+		<edge from-layer="9" from-port="3" to-layer="10" to-port="0" />
+	</edges>
+	<rt_info>
+		<add_attention_mask value="True" />
+		<add_prefix_space />
+		<add_special_tokens value="True" />
+		<chat_template value="{%- if tools %}&#10;    {{- '&lt;|im_start|>system\n' }}&#10;    {%- if messages[0].role == 'system' %}&#10;        {{- messages[0].content + '\n\n' }}&#10;    {%- endif %}&#10;    {{- &quot;# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within &lt;tools>&lt;/tools> XML tags:\n&lt;tools>&quot; }}&#10;    {%- for tool in tools %}&#10;        {{- &quot;\n&quot; }}&#10;        {{- tool | tojson }}&#10;    {%- endfor %}&#10;    {{- &quot;\n&lt;/tools>\n\nFor each function call, return a json object with function name and arguments within &lt;tool_call>&lt;/tool_call> XML tags:\n&lt;tool_call>\n{\&quot;name\&quot;: &lt;function-name>, \&quot;arguments\&quot;: &lt;args-json-object>}\n&lt;/tool_call>&lt;|im_end|>\n&quot; }}&#10;{%- else %}&#10;    {%- if messages[0].role == 'system' %}&#10;        {{- '&lt;|im_start|>system\n' + messages[0].content + '&lt;|im_end|>\n' }}&#10;    {%- endif %}&#10;{%- endif %}&#10;{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}&#10;{%- for message in messages[::-1] %}&#10;    {%- set index = (messages|length - 1) - loop.index0 %}&#10;    {%- if ns.multi_step_tool and message.role == &quot;user&quot; and not(message.content.startswith('&lt;tool_response>') and message.content.endswith('&lt;/tool_response>')) %}&#10;        {%- set ns.multi_step_tool = false %}&#10;        {%- set ns.last_query_index = index %}&#10;    {%- endif %}&#10;{%- endfor %}&#10;{%- for message in messages %}&#10;    {%- if (message.role == &quot;user&quot;) or (message.role == &quot;system&quot; and not loop.first) %}&#10;        {{- '&lt;|im_start|>' + message.role + '\n' + message.content + '&lt;|im_end|>' + '\n' }}&#10;    {%- elif message.role == &quot;assistant&quot; %}&#10;        {%- set content = message.content %}&#10;        {%- set reasoning_content = '' %}&#10;        {%- if message.reasoning_content is defined and message.reasoning_content is not none %}&#10;            {%- set reasoning_content = message.reasoning_content %}&#10;        {%- else %}&#10;            {%- if '&lt;/think>' in message.content %}&#10;                {%- set content = message.content.split('&lt;/think>')[-1].lstrip('\n') %}&#10;                {%- set reasoning_content = message.content.split('&lt;/think>')[0].rstrip('\n').split('&lt;think>')[-1].lstrip('\n') %}&#10;            {%- endif %}&#10;        {%- endif %}&#10;        {%- if loop.index0 > ns.last_query_index %}&#10;            {%- if loop.last or (not loop.last and reasoning_content) %}&#10;                {{- '&lt;|im_start|>' + message.role + '\n&lt;think>\n' + reasoning_content.strip('\n') + '\n&lt;/think>\n\n' + content.lstrip('\n') }}&#10;            {%- else %}&#10;                {{- '&lt;|im_start|>' + message.role + '\n' + content }}&#10;            {%- endif %}&#10;        {%- else %}&#10;            {{- '&lt;|im_start|>' + message.role + '\n' + content }}&#10;        {%- endif %}&#10;        {%- if message.tool_calls %}&#10;            {%- for tool_call in message.tool_calls %}&#10;                {%- if (loop.first and content) or (not loop.first) %}&#10;                    {{- '\n' }}&#10;                {%- endif %}&#10;                {%- if tool_call.function %}&#10;                    {%- set tool_call = tool_call.function %}&#10;                {%- endif %}&#10;                {{- '&lt;tool_call>\n{&quot;name&quot;: &quot;' }}&#10;                {{- tool_call.name }}&#10;                {{- '&quot;, &quot;arguments&quot;: ' }}&#10;                {%- if tool_call.arguments is string %}&#10;                    {{- tool_call.arguments }}&#10;                {%- else %}&#10;                    {{- tool_call.arguments | tojson }}&#10;                {%- endif %}&#10;                {{- '}\n&lt;/tool_call>' }}&#10;            {%- endfor %}&#10;        {%- endif %}&#10;        {{- '&lt;|im_end|>\n' }}&#10;    {%- elif message.role == &quot;tool&quot; %}&#10;        {%- if loop.first or (messages[loop.index0 - 1].role != &quot;tool&quot;) %}&#10;            {{- '&lt;|im_start|>user' }}&#10;        {%- endif %}&#10;        {{- '\n&lt;tool_response>\n' }}&#10;        {{- message.content }}&#10;        {{- '\n&lt;/tool_response>' }}&#10;        {%- if loop.last or (messages[loop.index0 + 1].role != &quot;tool&quot;) %}&#10;            {{- '&lt;|im_end|>\n' }}&#10;        {%- endif %}&#10;    {%- endif %}&#10;{%- endfor %}&#10;{%- if add_generation_prompt %}&#10;    {{- '&lt;|im_start|>assistant\n' }}&#10;    {%- if enable_thinking is defined and enable_thinking is false %}&#10;        {{- '&lt;think>\n\n&lt;/think>\n\n' }}&#10;    {%- endif %}&#10;{%- endif %}" />
+		<clean_up_tokenization_spaces />
+		<detokenizer_input_type value="i64" />
+		<eos_token_id value="151645" />
+		<handle_special_tokens_with_re />
+		<max_length />
+		<number_of_inputs value="1" />
+		<openvino_tokenizers_version value="2025.4.1.0-627-e79796a77f3" />
+		<openvino_version value="2025.4.1-20426-82bbf0292c5-releases/2025/4" />
+		<original_post_processor_template value="{&quot;type&quot;: &quot;Sequence&quot;, &quot;processors&quot;: [{&quot;type&quot;: &quot;ByteLevel&quot;, &quot;add_prefix_space&quot;: false, &quot;trim_offsets&quot;: false, &quot;use_regex&quot;: false}, {&quot;type&quot;: &quot;TemplateProcessing&quot;, &quot;single&quot;: [{&quot;Sequence&quot;: {&quot;id&quot;: &quot;A&quot;, &quot;type_id&quot;: 0}}, {&quot;SpecialToken&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;type_id&quot;: 0}}], &quot;pair&quot;: [{&quot;Sequence&quot;: {&quot;id&quot;: &quot;A&quot;, &quot;type_id&quot;: 0}}, {&quot;Sequence&quot;: {&quot;id&quot;: &quot;B&quot;, &quot;type_id&quot;: 0}}, {&quot;SpecialToken&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;type_id&quot;: 0}}], &quot;special_tokens&quot;: {&quot;&lt;|endoftext|>&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;ids&quot;: [151643], &quot;tokens&quot;: [&quot;&lt;|endoftext|>&quot;]}}}]}" />
+		<original_tokenizer_class value="&lt;class 'transformers.models.qwen2.tokenization_qwen2_fast.Qwen2TokenizerFast'>" />
+		<pad_token_id value="151643" />
+		<processed_post_processor_template value="{&quot;single&quot;: {&quot;ids&quot;: [-1, 151643], &quot;type_ids&quot;: [0, 0]}, &quot;pair&quot;: {&quot;ids&quot;: [-1, -2, 151643], &quot;type_ids&quot;: [0, 0, 0]}}" />
+		<skip_special_tokens value="True" />
+		<streaming_detokenizer value="False" />
+		<tokenizer_output_type value="i64" />
+		<tokenizers_version value="0.22.1" />
+		<transformers_version value="4.57.3" />
+		<use_max_padding value="False" />
+		<use_sentencepiece_backend value="False" />
+		<utf8_replace_mode value="replace" />
+		<with_detokenizer value="True" />
+	</rt_info>
+</net>

Qwen3-Embedding-0.6B-ov-int4/openvino_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21e1c79ff7a134a63b0cdcfae29d37032a33763891de9ac4845aee108cac23a3
+size 450782132

Qwen3-Embedding-0.6B-ov-int4/openvino_model.xml ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-0.6B-ov-int4/openvino_tokenizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c7f757b411ea311555082721b54f4519d4127f4907674390a3ebd5fc40bc8d6
+size 5588840

Qwen3-Embedding-0.6B-ov-int4/openvino_tokenizer.xml ADDED Viewed

	@@ -0,0 +1,799 @@

+<?xml version="1.0"?>
+<net name="tokenizer" version="11">
+	<layers>
+		<layer id="0" name="Parameter_73215" type="Parameter" version="opset1">
+			<data shape="?" element_type="string" />
+			<output>
+				<port id="0" precision="STRING" names="Parameter_73215">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="Constant_73221" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="2" name="StringTensorUnpack_73216" type="StringTensorUnpack" version="opset15">
+			<input>
+				<port id="0" precision="STRING">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="3" name="ShapeOf_73217" type="ShapeOf" version="opset3">
+			<data output_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="Constant_73218" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="5" name="Constant_73219" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="6" name="Gather_73220" type="Gather" version="opset8">
+			<data batch_dims="0" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I64" />
+			</output>
+		</layer>
+		<layer id="7" name="Constant_73222" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="8" name="Range_73223" type="Range" version="opset4">
+			<data output_type="i32" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="Constant_73224" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="10" name="Constant_73225" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="11" name="Add_73226" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+			</input>
+			<output>
+				<port id="2" precision="I64" />
+			</output>
+		</layer>
+		<layer id="12" name="Constant_73227" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="13" name="Range_73228" type="Range" version="opset4">
+			<data output_type="i32" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="14" name="Constant_73292" type="Const" version="opset1">
+			<data element_type="u8" shape="462" offset="16" size="462" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>462</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="15" name="SpecialTokensSplit_73293" type="SpecialTokensSplit" version="extension">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="U8">
+					<dim>462</dim>
+				</port>
+			</input>
+			<output>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="16" name="CharsMapNormalization_73294" type="CharsMapNormalization" version="extension">
+			<data add_dummy_prefix="false" remove_extra_whitespaces="false" escape_whitespaces="false" normalization_form="nfc" case_fold="false" nmt="false" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="4" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="17" name="Constant_73296" type="Const" version="opset1">
+			<data element_type="u8" shape="110" offset="478" size="110" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>110</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="18" name="RegexSplit_73297" type="RegexSplit" version="extension">
+			<data behaviour="isolate" invert="false" max_splits="-1" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="U8">
+					<dim>110</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="12" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="19" name="Constant_73299" type="Const" version="opset1">
+			<data element_type="i32" shape="151669" offset="588" size="606676" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151669</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="20" name="Constant_73301" type="Const" version="opset1">
+			<data element_type="i32" shape="151669" offset="607264" size="606676" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151669</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="21" name="Constant_73303" type="Const" version="opset1">
+			<data element_type="u8" shape="976309" offset="1213940" size="976309" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>976309</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="22" name="Constant_73311" type="Const" version="opset1">
+			<data element_type="i32" shape="151387" offset="2190249" size="605548" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151387</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="23" name="Constant_73313" type="Const" version="opset1">
+			<data element_type="i32" shape="151387" offset="2795797" size="605548" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151387</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="24" name="Constant_73315" type="Const" version="opset1">
+			<data element_type="u8" shape="491359" offset="3401345" size="491359" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>491359</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="25" name="Constant_73317" type="Const" version="opset1">
+			<data element_type="i32" shape="151387" offset="3892704" size="605548" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151387</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="26" name="Constant_73319" type="Const" version="opset1">
+			<data element_type="i32" shape="151387" offset="4498252" size="605548" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>151387</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="27" name="Constant_73321" type="Const" version="opset1">
+			<data element_type="u8" shape="484354" offset="5103800" size="484354" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>484354</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="28" name="Constant_73305" type="Const" version="opset1">
+			<data element_type="i32" shape="26" offset="5588154" size="104" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>26</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="29" name="Constant_73307" type="Const" version="opset1">
+			<data element_type="i32" shape="26" offset="5588258" size="104" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>26</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="30" name="Constant_73309" type="Const" version="opset1">
+			<data element_type="u8" shape="340" offset="5588362" size="340" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>340</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="31" name="Constant_73322" type="Const" version="opset1">
+			<data element_type="i32" shape="26" offset="5588702" size="104" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>26</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="32" name="BPETokenizer_73323" type="BPETokenizer" version="extension">
+			<data unk_token="" fuse_unk="false" suffix_indicator="" end_suffix="" byte_fallback="false" cache_capacity="30328" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="I32">
+					<dim>151669</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>151669</dim>
+				</port>
+				<port id="7" precision="U8">
+					<dim>976309</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>151387</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>151387</dim>
+				</port>
+				<port id="10" precision="U8">
+					<dim>491359</dim>
+				</port>
+				<port id="11" precision="I32">
+					<dim>151387</dim>
+				</port>
+				<port id="12" precision="I32">
+					<dim>151387</dim>
+				</port>
+				<port id="13" precision="U8">
+					<dim>484354</dim>
+				</port>
+				<port id="14" precision="I32">
+					<dim>26</dim>
+				</port>
+				<port id="15" precision="I32">
+					<dim>26</dim>
+				</port>
+				<port id="16" precision="U8">
+					<dim>340</dim>
+				</port>
+				<port id="17" precision="I32">
+					<dim>26</dim>
+				</port>
+			</input>
+			<output>
+				<port id="18" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="19" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="20" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="33" name="Constant_73324" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="5588806" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="34" name="Constant_73326" type="Const" version="opset1">
+			<data element_type="u8" shape="5" offset="5588810" size="5" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>5</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="35" name="Constant_73328" type="Const" version="opset1">
+			<data element_type="u8" shape="13" offset="5588815" size="13" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>13</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="36" name="Truncate_73329" type="Truncate" version="extension">
+			<data m_num_inputs="1" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32" />
+				<port id="4" precision="U8">
+					<dim>5</dim>
+				</port>
+				<port id="5" precision="U8">
+					<dim>13</dim>
+				</port>
+			</input>
+			<output>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="37" name="Constant_73330" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="5588828" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="38" name="Constant_73331" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="5588832" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="39" name="Constant_73332" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="5588836" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="40" name="Constant_73333" type="Const" version="opset1">
+			<data element_type="i32" shape="2" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>2</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="41" name="CombineSegments_73334" type="CombineSegments" version="extension">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32" />
+				<port id="4" precision="I32" />
+				<port id="5" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>2</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="12" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="42" name="Subtract_73335" type="Subtract" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="43" name="Constant_73336" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="5588828" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="44" name="ReduceMax_73337" type="ReduceMax" version="opset1">
+			<data keep_dims="false" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="I32" />
+			</output>
+		</layer>
+		<layer id="45" name="Constant_73338" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="5588836" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="46" name="RaggedToDense_73339" type="RaggedToDense" version="extension">
+			<data pad_right="true" m_pad_max_length="false" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32" />
+				<port id="4" precision="I32" />
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="BOOL">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="47" name="Convert_73340" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="BOOL">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="48" name="Convert_73340.0" type="Convert" version="opset1">
+			<data destination_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64" names="attention_mask">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="50" name="RaggedToDense_73339.0" type="Convert" version="opset1">
+			<data destination_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64" names="input_ids">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="51" name="Result_73343" type="Result" version="opset1" output_names="input_ids">
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+		<layer id="49" name="Result_73345" type="Result" version="opset1" output_names="attention_mask">
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="2" to-port="0" />
+		<edge from-layer="1" from-port="0" to-layer="8" to-port="0" />
+		<edge from-layer="2" from-port="1" to-layer="3" to-port="0" />
+		<edge from-layer="2" from-port="3" to-layer="15" to-port="4" />
+		<edge from-layer="2" from-port="2" to-layer="15" to-port="3" />
+		<edge from-layer="2" from-port="1" to-layer="15" to-port="2" />
+		<edge from-layer="3" from-port="1" to-layer="6" to-port="0" />
+		<edge from-layer="4" from-port="0" to-layer="6" to-port="1" />
+		<edge from-layer="5" from-port="0" to-layer="6" to-port="2" />
+		<edge from-layer="6" from-port="3" to-layer="11" to-port="0" />
+		<edge from-layer="6" from-port="3" to-layer="8" to-port="1" />
+		<edge from-layer="7" from-port="0" to-layer="8" to-port="2" />
+		<edge from-layer="8" from-port="3" to-layer="15" to-port="0" />
+		<edge from-layer="9" from-port="0" to-layer="13" to-port="0" />
+		<edge from-layer="10" from-port="0" to-layer="11" to-port="1" />
+		<edge from-layer="11" from-port="2" to-layer="13" to-port="1" />
+		<edge from-layer="12" from-port="0" to-layer="13" to-port="2" />
+		<edge from-layer="13" from-port="3" to-layer="15" to-port="1" />
+		<edge from-layer="14" from-port="0" to-layer="15" to-port="5" />
+		<edge from-layer="15" from-port="11" to-layer="16" to-port="3" />
+		<edge from-layer="15" from-port="7" to-layer="18" to-port="1" />
+		<edge from-layer="15" from-port="6" to-layer="18" to-port="0" />
+		<edge from-layer="15" from-port="10" to-layer="16" to-port="2" />
+		<edge from-layer="15" from-port="9" to-layer="16" to-port="1" />
+		<edge from-layer="15" from-port="8" to-layer="16" to-port="0" />
+		<edge from-layer="16" from-port="4" to-layer="18" to-port="2" />
+		<edge from-layer="16" from-port="5" to-layer="18" to-port="3" />
+		<edge from-layer="16" from-port="6" to-layer="18" to-port="4" />
+		<edge from-layer="16" from-port="7" to-layer="18" to-port="5" />
+		<edge from-layer="17" from-port="0" to-layer="18" to-port="6" />
+		<edge from-layer="18" from-port="7" to-layer="32" to-port="0" />
+		<edge from-layer="18" from-port="8" to-layer="32" to-port="1" />
+		<edge from-layer="18" from-port="9" to-layer="32" to-port="2" />
+		<edge from-layer="18" from-port="10" to-layer="32" to-port="3" />
+		<edge from-layer="18" from-port="11" to-layer="32" to-port="4" />
+		<edge from-layer="19" from-port="0" to-layer="32" to-port="5" />
+		<edge from-layer="20" from-port="0" to-layer="32" to-port="6" />
+		<edge from-layer="21" from-port="0" to-layer="32" to-port="7" />
+		<edge from-layer="22" from-port="0" to-layer="32" to-port="8" />
+		<edge from-layer="23" from-port="0" to-layer="32" to-port="9" />
+		<edge from-layer="24" from-port="0" to-layer="32" to-port="10" />
+		<edge from-layer="25" from-port="0" to-layer="32" to-port="11" />
+		<edge from-layer="26" from-port="0" to-layer="32" to-port="12" />
+		<edge from-layer="27" from-port="0" to-layer="32" to-port="13" />
+		<edge from-layer="28" from-port="0" to-layer="32" to-port="14" />
+		<edge from-layer="29" from-port="0" to-layer="32" to-port="15" />
+		<edge from-layer="30" from-port="0" to-layer="32" to-port="16" />
+		<edge from-layer="31" from-port="0" to-layer="32" to-port="17" />
+		<edge from-layer="32" from-port="18" to-layer="36" to-port="0" />
+		<edge from-layer="32" from-port="19" to-layer="36" to-port="1" />
+		<edge from-layer="32" from-port="20" to-layer="36" to-port="2" />
+		<edge from-layer="33" from-port="0" to-layer="36" to-port="3" />
+		<edge from-layer="34" from-port="0" to-layer="36" to-port="4" />
+		<edge from-layer="35" from-port="0" to-layer="36" to-port="5" />
+		<edge from-layer="36" from-port="8" to-layer="41" to-port="2" />
+		<edge from-layer="36" from-port="6" to-layer="41" to-port="0" />
+		<edge from-layer="36" from-port="7" to-layer="41" to-port="1" />
+		<edge from-layer="37" from-port="0" to-layer="41" to-port="3" />
+		<edge from-layer="38" from-port="0" to-layer="41" to-port="4" />
+		<edge from-layer="39" from-port="0" to-layer="41" to-port="5" />
+		<edge from-layer="40" from-port="0" to-layer="41" to-port="6" />
+		<edge from-layer="41" from-port="7" to-layer="46" to-port="0" />
+		<edge from-layer="41" from-port="9" to-layer="46" to-port="2" />
+		<edge from-layer="41" from-port="8" to-layer="46" to-port="1" />
+		<edge from-layer="41" from-port="7" to-layer="42" to-port="1" />
+		<edge from-layer="41" from-port="8" to-layer="42" to-port="0" />
+		<edge from-layer="42" from-port="2" to-layer="44" to-port="0" />
+		<edge from-layer="43" from-port="0" to-layer="44" to-port="1" />
+		<edge from-layer="44" from-port="2" to-layer="46" to-port="3" />
+		<edge from-layer="45" from-port="0" to-layer="46" to-port="4" />
+		<edge from-layer="46" from-port="6" to-layer="47" to-port="0" />
+		<edge from-layer="46" from-port="5" to-layer="50" to-port="0" />
+		<edge from-layer="47" from-port="1" to-layer="48" to-port="0" />
+		<edge from-layer="48" from-port="1" to-layer="49" to-port="0" />
+		<edge from-layer="50" from-port="1" to-layer="51" to-port="0" />
+	</edges>
+	<rt_info>
+		<add_attention_mask value="True" />
+		<add_prefix_space />
+		<add_special_tokens value="True" />
+		<chat_template value="{%- if tools %}&#10;    {{- '&lt;|im_start|>system\n' }}&#10;    {%- if messages[0].role == 'system' %}&#10;        {{- messages[0].content + '\n\n' }}&#10;    {%- endif %}&#10;    {{- &quot;# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within &lt;tools>&lt;/tools> XML tags:\n&lt;tools>&quot; }}&#10;    {%- for tool in tools %}&#10;        {{- &quot;\n&quot; }}&#10;        {{- tool | tojson }}&#10;    {%- endfor %}&#10;    {{- &quot;\n&lt;/tools>\n\nFor each function call, return a json object with function name and arguments within &lt;tool_call>&lt;/tool_call> XML tags:\n&lt;tool_call>\n{\&quot;name\&quot;: &lt;function-name>, \&quot;arguments\&quot;: &lt;args-json-object>}\n&lt;/tool_call>&lt;|im_end|>\n&quot; }}&#10;{%- else %}&#10;    {%- if messages[0].role == 'system' %}&#10;        {{- '&lt;|im_start|>system\n' + messages[0].content + '&lt;|im_end|>\n' }}&#10;    {%- endif %}&#10;{%- endif %}&#10;{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}&#10;{%- for message in messages[::-1] %}&#10;    {%- set index = (messages|length - 1) - loop.index0 %}&#10;    {%- if ns.multi_step_tool and message.role == &quot;user&quot; and not(message.content.startswith('&lt;tool_response>') and message.content.endswith('&lt;/tool_response>')) %}&#10;        {%- set ns.multi_step_tool = false %}&#10;        {%- set ns.last_query_index = index %}&#10;    {%- endif %}&#10;{%- endfor %}&#10;{%- for message in messages %}&#10;    {%- if (message.role == &quot;user&quot;) or (message.role == &quot;system&quot; and not loop.first) %}&#10;        {{- '&lt;|im_start|>' + message.role + '\n' + message.content + '&lt;|im_end|>' + '\n' }}&#10;    {%- elif message.role == &quot;assistant&quot; %}&#10;        {%- set content = message.content %}&#10;        {%- set reasoning_content = '' %}&#10;        {%- if message.reasoning_content is defined and message.reasoning_content is not none %}&#10;            {%- set reasoning_content = message.reasoning_content %}&#10;        {%- else %}&#10;            {%- if '&lt;/think>' in message.content %}&#10;                {%- set content = message.content.split('&lt;/think>')[-1].lstrip('\n') %}&#10;                {%- set reasoning_content = message.content.split('&lt;/think>')[0].rstrip('\n').split('&lt;think>')[-1].lstrip('\n') %}&#10;            {%- endif %}&#10;        {%- endif %}&#10;        {%- if loop.index0 > ns.last_query_index %}&#10;            {%- if loop.last or (not loop.last and reasoning_content) %}&#10;                {{- '&lt;|im_start|>' + message.role + '\n&lt;think>\n' + reasoning_content.strip('\n') + '\n&lt;/think>\n\n' + content.lstrip('\n') }}&#10;            {%- else %}&#10;                {{- '&lt;|im_start|>' + message.role + '\n' + content }}&#10;            {%- endif %}&#10;        {%- else %}&#10;            {{- '&lt;|im_start|>' + message.role + '\n' + content }}&#10;        {%- endif %}&#10;        {%- if message.tool_calls %}&#10;            {%- for tool_call in message.tool_calls %}&#10;                {%- if (loop.first and content) or (not loop.first) %}&#10;                    {{- '\n' }}&#10;                {%- endif %}&#10;                {%- if tool_call.function %}&#10;                    {%- set tool_call = tool_call.function %}&#10;                {%- endif %}&#10;                {{- '&lt;tool_call>\n{&quot;name&quot;: &quot;' }}&#10;                {{- tool_call.name }}&#10;                {{- '&quot;, &quot;arguments&quot;: ' }}&#10;                {%- if tool_call.arguments is string %}&#10;                    {{- tool_call.arguments }}&#10;                {%- else %}&#10;                    {{- tool_call.arguments | tojson }}&#10;                {%- endif %}&#10;                {{- '}\n&lt;/tool_call>' }}&#10;            {%- endfor %}&#10;        {%- endif %}&#10;        {{- '&lt;|im_end|>\n' }}&#10;    {%- elif message.role == &quot;tool&quot; %}&#10;        {%- if loop.first or (messages[loop.index0 - 1].role != &quot;tool&quot;) %}&#10;            {{- '&lt;|im_start|>user' }}&#10;        {%- endif %}&#10;        {{- '\n&lt;tool_response>\n' }}&#10;        {{- message.content }}&#10;        {{- '\n&lt;/tool_response>' }}&#10;        {%- if loop.last or (messages[loop.index0 + 1].role != &quot;tool&quot;) %}&#10;            {{- '&lt;|im_end|>\n' }}&#10;        {%- endif %}&#10;    {%- endif %}&#10;{%- endfor %}&#10;{%- if add_generation_prompt %}&#10;    {{- '&lt;|im_start|>assistant\n' }}&#10;    {%- if enable_thinking is defined and enable_thinking is false %}&#10;        {{- '&lt;think>\n\n&lt;/think>\n\n' }}&#10;    {%- endif %}&#10;{%- endif %}" />
+		<clean_up_tokenization_spaces />
+		<detokenizer_input_type value="i64" />
+		<eos_token_id value="151645" />
+		<handle_special_tokens_with_re />
+		<max_length />
+		<number_of_inputs value="1" />
+		<openvino_tokenizers_version value="2025.4.1.0-627-e79796a77f3" />
+		<openvino_version value="2025.4.1-20426-82bbf0292c5-releases/2025/4" />
+		<original_post_processor_template value="{&quot;type&quot;: &quot;Sequence&quot;, &quot;processors&quot;: [{&quot;type&quot;: &quot;ByteLevel&quot;, &quot;add_prefix_space&quot;: false, &quot;trim_offsets&quot;: false, &quot;use_regex&quot;: false}, {&quot;type&quot;: &quot;TemplateProcessing&quot;, &quot;single&quot;: [{&quot;Sequence&quot;: {&quot;id&quot;: &quot;A&quot;, &quot;type_id&quot;: 0}}, {&quot;SpecialToken&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;type_id&quot;: 0}}], &quot;pair&quot;: [{&quot;Sequence&quot;: {&quot;id&quot;: &quot;A&quot;, &quot;type_id&quot;: 0}}, {&quot;Sequence&quot;: {&quot;id&quot;: &quot;B&quot;, &quot;type_id&quot;: 0}}, {&quot;SpecialToken&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;type_id&quot;: 0}}], &quot;special_tokens&quot;: {&quot;&lt;|endoftext|>&quot;: {&quot;id&quot;: &quot;&lt;|endoftext|>&quot;, &quot;ids&quot;: [151643], &quot;tokens&quot;: [&quot;&lt;|endoftext|>&quot;]}}}]}" />
+		<original_tokenizer_class value="&lt;class 'transformers.models.qwen2.tokenization_qwen2_fast.Qwen2TokenizerFast'>" />
+		<pad_token_id value="151643" />
+		<processed_post_processor_template value="{&quot;single&quot;: {&quot;ids&quot;: [-1, 151643], &quot;type_ids&quot;: [0, 0]}, &quot;pair&quot;: {&quot;ids&quot;: [-1, -2, 151643], &quot;type_ids&quot;: [0, 0, 0]}}" />
+		<simplified_chat_template value="{% for message in messages %}{% if loop.first and messages[0]['role'] != 'system' %}{{ '&lt;|im_start|>system&#10;You are a helpful assistant.&lt;|im_end|>&#10;' }}{% endif %}{{'&lt;|im_start|>' + message['role'] + '&#10;' + message['content'] + '&lt;|im_end|>' + '&#10;'}}{% endfor %}{% if add_generation_prompt %}{{ '&lt;|im_start|>assistant&#10;' }}{% endif %}" />
+		<skip_special_tokens value="True" />
+		<streaming_detokenizer value="False" />
+		<tokenizer_output_type value="i64" />
+		<tokenizers_version value="0.22.1" />
+		<transformers_version value="4.57.3" />
+		<use_max_padding value="False" />
+		<use_sentencepiece_backend value="False" />
+		<utf8_replace_mode value="replace" />
+		<with_detokenizer value="True" />
+	</rt_info>
+</net>

Qwen3-Embedding-0.6B-ov-int4/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|object_ref_start|>",
+    "<|object_ref_end|>",
+    "<|box_start|>",
+    "<|box_end|>",
+    "<|quad_start|>",
+    "<|quad_end|>",
+    "<|vision_start|>",
+    "<|vision_end|>",
+    "<|vision_pad|>",
+    "<|image_pad|>",
+    "<|video_pad|>"
+  ],
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

Qwen3-Embedding-0.6B-ov-int4/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:def76fb086971c7867b829c23a26261e38d9d74e02139253b38aeb9df8b4b50a
+size 11423705

Qwen3-Embedding-0.6B-ov-int4/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,239 @@

+{
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151646": {
+      "content": "<|object_ref_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151647": {
+      "content": "<|object_ref_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151648": {
+      "content": "<|box_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151649": {
+      "content": "<|box_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151650": {
+      "content": "<|quad_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151651": {
+      "content": "<|quad_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151652": {
+      "content": "<|vision_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151653": {
+      "content": "<|vision_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151654": {
+      "content": "<|vision_pad|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151655": {
+      "content": "<|image_pad|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151656": {
+      "content": "<|video_pad|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151657": {
+      "content": "<tool_call>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151658": {
+      "content": "</tool_call>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151659": {
+      "content": "<|fim_prefix|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151660": {
+      "content": "<|fim_middle|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151661": {
+      "content": "<|fim_suffix|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151662": {
+      "content": "<|fim_pad|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151663": {
+      "content": "<|repo_name|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151664": {
+      "content": "<|file_sep|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151665": {
+      "content": "<tool_response>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151666": {
+      "content": "</tool_response>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151667": {
+      "content": "<think>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "151668": {
+      "content": "</think>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    }
+  },
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|object_ref_start|>",
+    "<|object_ref_end|>",
+    "<|box_start|>",
+    "<|box_end|>",
+    "<|quad_start|>",
+    "<|quad_end|>",
+    "<|vision_start|>",
+    "<|vision_end|>",
+    "<|vision_pad|>",
+    "<|image_pad|>",
+    "<|video_pad|>"
+  ],
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "extra_special_tokens": {},
+  "model_max_length": 131072,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

Qwen3-Embedding-0.6B-ov-int4/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-0.6B-ov-int8/added_tokens.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "</think>": 151668,
+  "</tool_call>": 151658,
+  "</tool_response>": 151666,
+  "<think>": 151667,
+  "<tool_call>": 151657,
+  "<tool_response>": 151665,
+  "<|box_end|>": 151649,
+  "<|box_start|>": 151648,
+  "<|endoftext|>": 151643,
+  "<|file_sep|>": 151664,
+  "<|fim_middle|>": 151660,
+  "<|fim_pad|>": 151662,
+  "<|fim_prefix|>": 151659,
+  "<|fim_suffix|>": 151661,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644,
+  "<|image_pad|>": 151655,
+  "<|object_ref_end|>": 151647,
+  "<|object_ref_start|>": 151646,
+  "<|quad_end|>": 151651,
+  "<|quad_start|>": 151650,
+  "<|repo_name|>": 151663,
+  "<|video_pad|>": 151656,
+  "<|vision_end|>": 151653,
+  "<|vision_pad|>": 151654,
+  "<|vision_start|>": 151652
+}

Qwen3-Embedding-0.6B-ov-int8/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,85 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0].role == 'system' %}
+        {{- messages[0].content + '\n\n' }}
+    {%- endif %}
+    {{- "# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0].role == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0].content + '<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}
+{%- for message in messages[::-1] %}
+    {%- set index = (messages|length - 1) - loop.index0 %}
+    {%- if ns.multi_step_tool and message.role == "user" and not(message.content.startswith('<tool_response>') and message.content.endswith('</tool_response>')) %}
+        {%- set ns.multi_step_tool = false %}
+        {%- set ns.last_query_index = index %}
+    {%- endif %}
+{%- endfor %}
+{%- for message in messages %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) %}
+        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {%- set content = message.content %}
+        {%- set reasoning_content = '' %}
+        {%- if message.reasoning_content is defined and message.reasoning_content is not none %}
+            {%- set reasoning_content = message.reasoning_content %}
+        {%- else %}
+            {%- if '</think>' in message.content %}
+                {%- set content = message.content.split('</think>')[-1].lstrip('\n') %}
+                {%- set reasoning_content = message.content.split('</think>')[0].rstrip('\n').split('<think>')[-1].lstrip('\n') %}
+            {%- endif %}
+        {%- endif %}
+        {%- if loop.index0 > ns.last_query_index %}
+            {%- if loop.last or (not loop.last and reasoning_content) %}
+                {{- '<|im_start|>' + message.role + '\n<think>\n' + reasoning_content.strip('\n') + '\n</think>\n\n' + content.lstrip('\n') }}
+            {%- else %}
+                {{- '<|im_start|>' + message.role + '\n' + content }}
+            {%- endif %}
+        {%- else %}
+            {{- '<|im_start|>' + message.role + '\n' + content }}
+        {%- endif %}
+        {%- if message.tool_calls %}
+            {%- for tool_call in message.tool_calls %}
+                {%- if (loop.first and content) or (not loop.first) %}
+                    {{- '\n' }}
+                {%- endif %}
+                {%- if tool_call.function %}
+                    {%- set tool_call = tool_call.function %}
+                {%- endif %}
+                {{- '<tool_call>\n{"name": "' }}
+                {{- tool_call.name }}
+                {{- '", "arguments": ' }}
+                {%- if tool_call.arguments is string %}
+                    {{- tool_call.arguments }}
+                {%- else %}
+                    {{- tool_call.arguments | tojson }}
+                {%- endif %}
+                {{- '}\n</tool_call>' }}
+            {%- endfor %}
+        {%- endif %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if loop.first or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- message.content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+    {%- if enable_thinking is defined and enable_thinking is false %}
+        {{- '<think>\n\n</think>\n\n' }}
+    {%- endif %}
+{%- endif %}

Qwen3-Embedding-0.6B-ov-int8/config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "architectures": [
+    "Qwen3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "dtype": "float32",
+  "eos_token_id": 151643,
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_types": [
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 28,
+  "model_type": "qwen3",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 1000000,
+  "sliding_window": null,
+  "tie_word_embeddings": true,
+  "transformers_version": "4.57.3",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151669
+}

Qwen3-Embedding-0.6B-ov-int8/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-0.6B-ov-int8/model_cache/10398472748164076480.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cea6db01e75c76d8eb37b65365b63d200e1ae11d54f2aa98fc0d030563288286
+size 144120

Qwen3-Embedding-0.6B-ov-int8/model_cache/12113472825542766259.cl_cache ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a8553d33a68b2fd75160e85a9932a5a70317cd4f73e6aa56929e57dd1ef6aef
+size 177552