quockhangdev commited on Apr 29

Commit

d1137f1

verified ·

1 Parent(s): 334746a

Qwen3-Embedding-4B-vilegal-stage2-adapter

Browse files

Files changed (48) hide show

.gitattributes +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/1_Pooling/config.json +5 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/README.md +0 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/adapter_config.json +48 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/adapter_model.safetensors +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/chat_template.jinja +54 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/1_Pooling/config.json +5 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/README.md +0 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/adapter_config.json +48 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/adapter_model.safetensors +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/chat_template.jinja +54 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/config_sentence_transformers.json +14 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/modules.json +20 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/optimizer.pt +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_0.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_1.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_2.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_3.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/scheduler.pt +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/sentence_bert_config.json +10 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/tokenizer.json +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/tokenizer_config.json +15 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/trainer_state.json +62 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/training_args.bin +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/1_Pooling/config.json +5 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/README.md +0 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/adapter_config.json +48 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/adapter_model.safetensors +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/chat_template.jinja +54 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/config_sentence_transformers.json +14 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/modules.json +20 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/optimizer.pt +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_0.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_1.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_2.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_3.pth +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/scheduler.pt +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/sentence_bert_config.json +10 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/tokenizer.json +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/tokenizer_config.json +15 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/trainer_state.json +62 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/training_args.bin +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/config_sentence_transformers.json +14 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/modules.json +20 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/sentence_bert_config.json +10 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/tokenizer.json +3 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/tokenizer_config.json +15 -0
Qwen3-Embedding-4B-vilegal-stage2-adapter/training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -54,3 +54,6 @@ Qwen3-Embedding-4B-peft-vilegal-stage1-ok/hf_model/tokenizer.json filter=lfs dif
 Qwen3-Embedding-4B-peft-vilegal-stage2-ok/checkpoint-218/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 Qwen3-Embedding-4B-peft-vilegal-stage2-ok/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 Qwen3-Embedding-4B-merged/tokenizer.json filter=lfs diff=lfs merge=lfs -text

 Qwen3-Embedding-4B-peft-vilegal-stage2-ok/checkpoint-218/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 Qwen3-Embedding-4B-peft-vilegal-stage2-ok/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 Qwen3-Embedding-4B-merged/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+Qwen3-Embedding-4B-vilegal-stage2-adapter/tokenizer.json filter=lfs diff=lfs merge=lfs -text

Qwen3-Embedding-4B-vilegal-stage2-adapter/1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+    "embedding_dimension": 2560,
+    "pooling_mode": "lasttoken",
+    "include_prompt": true
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/README.md ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-4B-vilegal-stage2-adapter/adapter_config.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "alora_invocation_tokens": null,
+  "alpha_pattern": {},
+  "arrow_config": null,
+  "auto_mapping": null,
+  "base_model_name_or_path": "./hf_model/Qwen3-Embedding-4B-vilegal-stage1-merged",
+  "bias": "none",
+  "corda_config": null,
+  "ensure_weight_tying": false,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": false,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 64,
+  "lora_bias": false,
+  "lora_dropout": 0,
+  "lora_ga_config": null,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "peft_version": "0.19.1",
+  "qalora_group_size": 16,
+  "r": 32,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "down_proj",
+    "k_proj",
+    "gate_proj",
+    "v_proj",
+    "q_proj",
+    "up_proj"
+  ],
+  "target_parameters": null,
+  "task_type": "FEATURE_EXTRACTION",
+  "trainable_token_indices": null,
+  "use_bdlora": null,
+  "use_dora": false,
+  "use_qalora": false,
+  "use_rslora": false
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e69154cafdba793cd8a2a1af3bde44168857d02445c1f1073847657b1554399
+size 132185368

Qwen3-Embedding-4B-vilegal-stage2-adapter/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,54 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- messages[0]['content'] }}
+    {%- else %}
+        {{- 'You are a helpful assistant.' }}
+    {%- endif %}
+    {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
+    {%- else %}
+        {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- for message in messages %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
+        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {{- '<|im_start|>' + message.role }}
+        {%- if message.content %}
+            {{- '\n' + message.content }}
+        {%- endif %}
+        {%- for tool_call in message.tool_calls %}
+            {%- if tool_call.function is defined %}
+                {%- set tool_call = tool_call.function %}
+            {%- endif %}
+            {{- '\n<tool_call>\n{"name": "' }}
+            {{- tool_call.name }}
+            {{- '", "arguments": ' }}
+            {{- tool_call.arguments | tojson }}
+            {{- '}\n</tool_call>' }}
+        {%- endfor %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- message.content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+{%- endif %}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+    "embedding_dimension": 2560,
+    "pooling_mode": "lasttoken",
+    "include_prompt": true
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/README.md ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/adapter_config.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "alora_invocation_tokens": null,
+  "alpha_pattern": {},
+  "arrow_config": null,
+  "auto_mapping": null,
+  "base_model_name_or_path": "./hf_model/Qwen3-Embedding-4B-vilegal-stage1-merged",
+  "bias": "none",
+  "corda_config": null,
+  "ensure_weight_tying": false,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": false,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 64,
+  "lora_bias": false,
+  "lora_dropout": 0,
+  "lora_ga_config": null,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "peft_version": "0.19.1",
+  "qalora_group_size": 16,
+  "r": 32,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "down_proj",
+    "k_proj",
+    "gate_proj",
+    "v_proj",
+    "q_proj",
+    "up_proj"
+  ],
+  "target_parameters": null,
+  "task_type": "FEATURE_EXTRACTION",
+  "trainable_token_indices": null,
+  "use_bdlora": null,
+  "use_dora": false,
+  "use_qalora": false,
+  "use_rslora": false
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:194143ee8d7722be2de95ce9e898c47ff7961ad885e8f6408783edc7f566f9e5
+size 132185368

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,54 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- messages[0]['content'] }}
+    {%- else %}
+        {{- 'You are a helpful assistant.' }}
+    {%- endif %}
+    {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
+    {%- else %}
+        {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- for message in messages %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
+        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {{- '<|im_start|>' + message.role }}
+        {%- if message.content %}
+            {{- '\n' + message.content }}
+        {%- endif %}
+        {%- for tool_call in message.tool_calls %}
+            {%- if tool_call.function is defined %}
+                {%- set tool_call = tool_call.function %}
+            {%- endif %}
+            {{- '\n<tool_call>\n{"name": "' }}
+            {{- tool_call.name }}
+            {{- '", "arguments": ' }}
+            {{- tool_call.arguments | tojson }}
+            {{- '}\n</tool_call>' }}
+        {%- endfor %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- message.content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+{%- endif %}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "__version__": {
+    "pytorch": "2.11.0+cu130",
+    "sentence_transformers": "5.4.1",
+    "transformers": "5.6.2"
+  },
+  "default_prompt_name": null,
+  "model_type": "SentenceTransformer",
+  "prompts": {
+    "document": "",
+    "query": "Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.\nQuery:"
+  },
+  "similarity_fn_name": "cosine"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/modules.json ADDED Viewed

	@@ -0,0 +1,20 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.base.modules.transformer.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Normalize",
+    "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
+  }
+]

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8eefdf6c967f23e239f8e0d231a6f8111f4deb1157239e0fc01fa7a6ac36785a
+size 264674251

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91c7818cff7cfa15ac036e7d99de57c66f3546948d0318970e66adffa11ae356
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf1ddbbdd3e2b2a4fc0d6c20dda2cf27bf4d264d3993040c2f54879967d25602
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90bb92e49c2b434e9c058486aee05ba9e57c4012dd4b97815840ef2bc7680ce9
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27b767392d13194694df8f64661d6ff484ea9f25addbb98712993567a100e422
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:563eebbaedd958aa09c470cc7ed7774518b8d1eb9c526c382e519884d621424c
+size 1465

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "transformer_task": "feature-extraction",
+    "modality_config": {
+        "text": {
+            "method": "forward",
+            "method_output_name": "last_hidden_state"
+        }
+    },
+    "module_output_name": "token_embeddings"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24712070ac72a218115ee256fd28888777437366e4c1b2ed70b21f75561eb90e
+size 11423042

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "is_local": true,
+  "local_files_only": false,
+  "model_max_length": 4096,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.9174311926605505,
+  "eval_steps": 500,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.22935779816513763,
+      "grad_norm": 0.189453125,
+      "learning_rate": 1.7244897959183674e-05,
+      "loss": 0.5653152084350586,
+      "step": 50
+    },
+    {
+      "epoch": 0.45871559633027525,
+      "grad_norm": 0.21484375,
+      "learning_rate": 1.2142857142857142e-05,
+      "loss": 0.5319932556152344,
+      "step": 100
+    },
+    {
+      "epoch": 0.6880733944954128,
+      "grad_norm": 0.203125,
+      "learning_rate": 7.0408163265306125e-06,
+      "loss": 0.5213391876220703,
+      "step": 150
+    },
+    {
+      "epoch": 0.9174311926605505,
+      "grad_norm": 0.21484375,
+      "learning_rate": 1.938775510204082e-06,
+      "loss": 0.5070155334472656,
+      "step": 200
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 218,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 50,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 512,
+  "trial_name": null,
+  "trial_params": null
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95d54605f8792813f284d2a1340defc13104f5fe87e7480bb1f729704bfe28ed
+size 5777

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+    "embedding_dimension": 2560,
+    "pooling_mode": "lasttoken",
+    "include_prompt": true
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/README.md ADDED Viewed

The diff for this file is too large to render. See raw diff

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/adapter_config.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "alora_invocation_tokens": null,
+  "alpha_pattern": {},
+  "arrow_config": null,
+  "auto_mapping": null,
+  "base_model_name_or_path": "./hf_model/Qwen3-Embedding-4B-vilegal-stage1-merged",
+  "bias": "none",
+  "corda_config": null,
+  "ensure_weight_tying": false,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": false,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 64,
+  "lora_bias": false,
+  "lora_dropout": 0,
+  "lora_ga_config": null,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "peft_version": "0.19.1",
+  "qalora_group_size": 16,
+  "r": 32,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "down_proj",
+    "k_proj",
+    "gate_proj",
+    "v_proj",
+    "q_proj",
+    "up_proj"
+  ],
+  "target_parameters": null,
+  "task_type": "FEATURE_EXTRACTION",
+  "trainable_token_indices": null,
+  "use_bdlora": null,
+  "use_dora": false,
+  "use_qalora": false,
+  "use_rslora": false
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e69154cafdba793cd8a2a1af3bde44168857d02445c1f1073847657b1554399
+size 132185368

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,54 @@

+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- messages[0]['content'] }}
+    {%- else %}
+        {{- 'You are a helpful assistant.' }}
+    {%- endif %}
+    {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0]['role'] == 'system' %}
+        {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
+    {%- else %}
+        {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- for message in messages %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
+        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {{- '<|im_start|>' + message.role }}
+        {%- if message.content %}
+            {{- '\n' + message.content }}
+        {%- endif %}
+        {%- for tool_call in message.tool_calls %}
+            {%- if tool_call.function is defined %}
+                {%- set tool_call = tool_call.function %}
+            {%- endif %}
+            {{- '\n<tool_call>\n{"name": "' }}
+            {{- tool_call.name }}
+            {{- '", "arguments": ' }}
+            {{- tool_call.arguments | tojson }}
+            {{- '}\n</tool_call>' }}
+        {%- endfor %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- message.content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n' }}
+{%- endif %}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "__version__": {
+    "pytorch": "2.11.0+cu130",
+    "sentence_transformers": "5.4.1",
+    "transformers": "5.6.2"
+  },
+  "default_prompt_name": null,
+  "model_type": "SentenceTransformer",
+  "prompts": {
+    "document": "",
+    "query": "Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.\nQuery:"
+  },
+  "similarity_fn_name": "cosine"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/modules.json ADDED Viewed

	@@ -0,0 +1,20 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.base.modules.transformer.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Normalize",
+    "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
+  }
+]

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:744cb6fef81608a88ca5d5c880cfdee5124c55d01bd1d3e127e680c814914509
+size 264674251

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91c7818cff7cfa15ac036e7d99de57c66f3546948d0318970e66adffa11ae356
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf1ddbbdd3e2b2a4fc0d6c20dda2cf27bf4d264d3993040c2f54879967d25602
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90bb92e49c2b434e9c058486aee05ba9e57c4012dd4b97815840ef2bc7680ce9
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27b767392d13194694df8f64661d6ff484ea9f25addbb98712993567a100e422
+size 15365

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4dcc8e8c457f0dc7de9dd42d7e2ba21b88d268c4fc098cc48309f6ab8d73116c
+size 1465

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "transformer_task": "feature-extraction",
+    "modality_config": {
+        "text": {
+            "method": "forward",
+            "method_output_name": "last_hidden_state"
+        }
+    },
+    "module_output_name": "token_embeddings"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24712070ac72a218115ee256fd28888777437366e4c1b2ed70b21f75561eb90e
+size 11423042

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "is_local": true,
+  "local_files_only": false,
+  "model_max_length": 4096,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 218,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.22935779816513763,
+      "grad_norm": 0.189453125,
+      "learning_rate": 1.7244897959183674e-05,
+      "loss": 0.5653152084350586,
+      "step": 50
+    },
+    {
+      "epoch": 0.45871559633027525,
+      "grad_norm": 0.21484375,
+      "learning_rate": 1.2142857142857142e-05,
+      "loss": 0.5319932556152344,
+      "step": 100
+    },
+    {
+      "epoch": 0.6880733944954128,
+      "grad_norm": 0.203125,
+      "learning_rate": 7.0408163265306125e-06,
+      "loss": 0.5213391876220703,
+      "step": 150
+    },
+    {
+      "epoch": 0.9174311926605505,
+      "grad_norm": 0.21484375,
+      "learning_rate": 1.938775510204082e-06,
+      "loss": 0.5070155334472656,
+      "step": 200
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 218,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 50,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 512,
+  "trial_name": null,
+  "trial_params": null
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/checkpoint-218/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95d54605f8792813f284d2a1340defc13104f5fe87e7480bb1f729704bfe28ed
+size 5777

Qwen3-Embedding-4B-vilegal-stage2-adapter/config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "__version__": {
+    "pytorch": "2.11.0+cu130",
+    "sentence_transformers": "5.4.1",
+    "transformers": "5.6.2"
+  },
+  "default_prompt_name": null,
+  "model_type": "SentenceTransformer",
+  "prompts": {
+    "document": "",
+    "query": "Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.\nQuery:"
+  },
+  "similarity_fn_name": "cosine"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/modules.json ADDED Viewed

	@@ -0,0 +1,20 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.base.modules.transformer.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Normalize",
+    "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
+  }
+]

Qwen3-Embedding-4B-vilegal-stage2-adapter/sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "transformer_task": "feature-extraction",
+    "modality_config": {
+        "text": {
+            "method": "forward",
+            "method_output_name": "last_hidden_state"
+        }
+    },
+    "module_output_name": "token_embeddings"
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24712070ac72a218115ee256fd28888777437366e4c1b2ed70b21f75561eb90e
+size 11423042

Qwen3-Embedding-4B-vilegal-stage2-adapter/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "is_local": true,
+  "local_files_only": false,
+  "model_max_length": 4096,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

Qwen3-Embedding-4B-vilegal-stage2-adapter/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95d54605f8792813f284d2a1340defc13104f5fe87e7480bb1f729704bfe28ed
+size 5777