Aleksandr Sobolev commited on Jun 22, 2024

Commit

1 Parent(s): 586162f

Upload model

Browse files

Files changed (33) hide show

.DS_Store +0 -0
.gitattributes +13 -0
GGUF/icaro-f16.gguf +3 -0
README.md +76 -3
adapter_config.json +37 -0
adapter_model.safetensors +3 -0
added_tokens.json +6 -0
assets/icaro.jpg +0 -0
config.json +30 -0
generation_config.json +6 -0
lora/adapter_config.json +37 -0
lora/adapter_model.safetensors +3 -0
lora/added_tokens.json +6 -0
lora/merges.txt +0 -0
lora/special_tokens_map.json +16 -0
lora/tokenizer.json +0 -0
lora/tokenizer_config.json +44 -0
lora/vocab.json +0 -0
merged_model/added_tokens.json +6 -0
merged_model/config.json +30 -0
merged_model/generation_config.json +6 -0
merged_model/merges.txt +0 -0
merged_model/model.safetensors +3 -0
merged_model/special_tokens_map.json +16 -0
merged_model/tokenizer.json +0 -0
merged_model/tokenizer_config.json +44 -0
merged_model/vocab.json +0 -0
merges.txt +0 -0
model.safetensors +3 -0
special_tokens_map.json +16 -0
tokenizer.json +0 -0
tokenizer_config.json +44 -0
vocab.json +0 -0

.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

.gitattributes CHANGED Viewed

@@ -33,3 +33,16 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+icaro-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+icaro-f16.gguf filter=lfs diff=lfs merge=lfs -text
+icaro-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+icaro-Q8_K.gguf filter=lfs diff=lfs merge=lfs -text
+icaro-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+icaro-IQ4_NL.gguf filter=lfs diff=lfs merge=lfs -text
+assets/icaro.png filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro-Q2_K_IMAT.gguf filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro-Q3_K_M_IMAT.gguf filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro-Q4_K_M_IMAT.gguf filter=lfs diff=lfs merge=lfs -text
+GGUF/icaro.imatrix filter=lfs diff=lfs merge=lfs -text

GGUF/icaro-f16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a3b84fe8be75a0230fed40545fcfec7c4465d12975351d898dc0e33a7d192f3
+size 3093666464

README.md CHANGED Viewed

@@ -1,3 +1,76 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+![icaro](https://huggingface.co/alexsobolev/Icaro-LM/resolve/main/assets/icaro.jpg)
+**Icaro-LM**, is a language model based on Qwen2 1.5B, designed for mobile efficiency, empathetic chat, and function calling.
+This model is optimized for fast inference and low resource consumption on mobile devices, providing a seamless and responsive user experience.
+Icaro-LM is fine-tuned for empathetic conversations and can understand and execute function calls within the conversation flow,
+making it a versatile solution for various applications.
+## Key Features:
+1. **Mobile Efficiency**: Optimized for fast inference and low resource consumption on mobile devices.
+2. **Empathetic Chat**: Fine-tuned on datasets curated for empathetic and emotionally intelligent conversations.
+3. **Function Calling**: Can understand and execute function calls within the conversation flow.
+## Use Cases:
+- Mobile chatbots and virtual assistants
+- Emotional support applications
+- Task automation on mobile devices
+## Prompt format
+```
+<|im_start|>system
+{system_prompt}<|im_end|>
+<|im_start|>user
+{prompt}<|im_end|>
+<|im_start|>assistant
+```
+## Function calling example
+```
+<|im_start|>system
+You are a helpful assistant with access to the following functions. Use them if required -[{
+   "name":"get_news",
+   "description":"Get the latest news.",
+   "parameters":{
+      "type":"object",
+      "properties":{
+         "location":{
+            "type":"string",
+            "description":"The location for which to fetch news"
+         }
+      },
+      "required":[
+         "location"
+      ]
+   }
+},
+{
+  "name": "get_current_weather",
+  "description": "Get the current weather",
+  "parameters": {
+      "type": "object",
+      "properties": {
+          "location": {
+              "type": "string",
+              "description": "The city and state, e.g. San Francisco, CA"
+          },
+      },
+      "required": ["location"],
+  },
+}]<|im_end|>
+<|im_start|>user
+What's the latest news in Samara?<|im_end|>
+<|im_start|>assistant
+```
+Result:
+```
+<|im_start|>assistant
+<functioncall> {"name": "get_news", "arguments": '{"location": "Samara"}'}  <|im_end|>
+```

adapter_config.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "unsloth/Qwen2-1.5b-bnb-4bit",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {
+    "loftq_bits": 4,
+    "loftq_iter": 1
+  },
+  "lora_alpha": 32,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 32,
+  "rank_pattern": {},
+  "revision": "unsloth",
+  "target_modules": [
+    "down_proj",
+    "up_proj",
+    "q_proj",
+    "v_proj",
+    "k_proj",
+    "gate_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": true
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3ce618b74fb93a321f505c284c9d204c83dfd50be440d03d30991d44400cd1f
+size 147770496

added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "<|PAD_TOKEN|>": 151646,
+  "<|endoftext|>": 151645,
+  "<|im_end|>": 151643,
+  "<|im_start|>": 151644
+}

assets/icaro.jpg ADDED Viewed

config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "unsloth/Qwen2-1.5b-bnb-4bit",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "hidden_act": "silu",
+  "hidden_size": 1536,
+  "initializer_range": 0.02,
+  "intermediate_size": 8960,
+  "max_position_embeddings": 131072,
+  "max_window_layers": 28,
+  "model_type": "qwen2",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 2,
+  "pad_token_id": 151646,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "unsloth_version": "2024.6",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "max_new_tokens": 2048,
+  "transformers_version": "4.41.2"
+}

lora/adapter_config.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "unsloth/Qwen2-1.5b-bnb-4bit",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {
+    "loftq_bits": 4,
+    "loftq_iter": 1
+  },
+  "lora_alpha": 32,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 32,
+  "rank_pattern": {},
+  "revision": "unsloth",
+  "target_modules": [
+    "down_proj",
+    "up_proj",
+    "q_proj",
+    "v_proj",
+    "k_proj",
+    "gate_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": true
+}

lora/adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3ce618b74fb93a321f505c284c9d204c83dfd50be440d03d30991d44400cd1f
+size 147770496

lora/added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "<|PAD_TOKEN|>": 151646,
+  "<|endoftext|>": 151645,
+  "<|im_end|>": 151643,
+  "<|im_start|>": 151644
+}

lora/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

lora/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|PAD_TOKEN|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

lora/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

lora/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151646": {
+      "content": "<|PAD_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": null,
+  "chat_template": "{% for message in messages %}{% if message['from'] == 'human' %}{{'<|im_start|>user\n' + message['value'] + '<|im_end|>\n'}}{% elif message['from'] == 'gpt' %}{{'<|im_start|>assistant\n' + message['value'] + '<|im_end|>\n' }}{% else %}{{ '<|im_start|>system\n' + message['value'] + '<|im_end|>\n' }}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|im_end|>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|PAD_TOKEN|>",
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

lora/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

merged_model/added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "<|PAD_TOKEN|>": 151646,
+  "<|endoftext|>": 151645,
+  "<|im_end|>": 151643,
+  "<|im_start|>": 151644
+}

merged_model/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "unsloth/Qwen2-1.5b-bnb-4bit",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "hidden_act": "silu",
+  "hidden_size": 1536,
+  "initializer_range": 0.02,
+  "intermediate_size": 8960,
+  "max_position_embeddings": 131072,
+  "max_window_layers": 28,
+  "model_type": "qwen2",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 2,
+  "pad_token_id": 151646,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "unsloth_version": "2024.6",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

merged_model/generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "max_new_tokens": 2048,
+  "transformers_version": "4.41.2"
+}

merged_model/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

merged_model/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:480320bef779942282a841420690aad346a5548254cdc13f50aafa7974a4f042
+size 3087467144

merged_model/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|PAD_TOKEN|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

merged_model/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

merged_model/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151646": {
+      "content": "<|PAD_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": null,
+  "chat_template": "{% for message in messages %}{% if message['from'] == 'human' %}{{'<|im_start|>user\n' + message['value'] + '<|im_end|>\n'}}{% elif message['from'] == 'gpt' %}{{'<|im_start|>assistant\n' + message['value'] + '<|im_end|>\n' }}{% else %}{{ '<|im_start|>system\n' + message['value'] + '<|im_end|>\n' }}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|im_end|>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|PAD_TOKEN|>",
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

merged_model/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:480320bef779942282a841420690aad346a5548254cdc13f50aafa7974a4f042
+size 3087467144

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|PAD_TOKEN|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151646": {
+      "content": "<|PAD_TOKEN|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": null,
+  "chat_template": "{% for message in messages %}{% if message['from'] == 'human' %}{{'<|im_start|>user\n' + message['value'] + '<|im_end|>\n'}}{% elif message['from'] == 'gpt' %}{{'<|im_start|>assistant\n' + message['value'] + '<|im_end|>\n' }}{% else %}{{ '<|im_start|>system\n' + message['value'] + '<|im_end|>\n' }}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|im_end|>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|PAD_TOKEN|>",
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff