Training in progress, epoch 1

Browse files

Files changed (14) hide show

.gitattributes +1 -0
README.md +58 -0
adapter_config.json +54 -0
adapter_model.safetensors +3 -0
chat_template.jinja +47 -0
runs/Apr14_15-40-35_d5064a8e9c6f/events.out.tfevents.1776181235.d5064a8e9c6f.708.0 +3 -0
runs/Apr14_15-49-28_d5064a8e9c6f/events.out.tfevents.1776181768.d5064a8e9c6f.1029.0 +3 -0
runs/Apr14_16-19-28_d5064a8e9c6f/events.out.tfevents.1776183568.d5064a8e9c6f.1695.0 +3 -0
runs/Apr14_16-32-05_d5064a8e9c6f/events.out.tfevents.1776184325.d5064a8e9c6f.1922.0 +3 -0
runs/Apr14_16-43-40_d5064a8e9c6f/events.out.tfevents.1776185020.d5064a8e9c6f.2145.0 +3 -0
runs/Apr14_16-50-43_d5064a8e9c6f/events.out.tfevents.1776185443.d5064a8e9c6f.2371.0 +3 -0
tokenizer.json +3 -0
tokenizer_config.json +25 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,58 @@

+---
+base_model: google/medgemma-1.5-4b-it
+library_name: transformers
+model_name: gemma-text-to-sql
+tags:
+- generated_from_trainer
+- trl
+- sft
+licence: license
+---
+# Model Card for gemma-text-to-sql
+This model is a fine-tuned version of [google/medgemma-1.5-4b-it](https://huggingface.co/google/medgemma-1.5-4b-it).
+It has been trained using [TRL](https://github.com/huggingface/trl).
+## Quick start
+```python
+from transformers import pipeline
+question = "If you had a time machine, but could only go to the past or the future once and never return, which would you choose and why?"
+generator = pipeline("text-generation", model="champ7/gemma-text-to-sql", device="cuda")
+output = generator([{"role": "user", "content": question}], max_new_tokens=128, return_full_text=False)[0]
+print(output["generated_text"])
+```
+## Training procedure
+This model was trained with SFT.
+### Framework versions
+- TRL: 1.1.0
+- Transformers: 5.5.4
+- Pytorch: 2.11.0+cu128
+- Datasets: 4.8.4
+- Tokenizers: 0.22.2
+## Citations
+Cite TRL as:
+```bibtex
+@software{vonwerra2020trl,
+  title   = {{TRL: Transformers Reinforcement Learning}},
+  author  = {von Werra, Leandro and Belkada, Younes and Tunstall, Lewis and Beeching, Edward and Thrush, Tristan and Lambert, Nathan and Huang, Shengyi and Rasul, Kashif and Gallouédec, Quentin},
+  license = {Apache-2.0},
+  url     = {https://github.com/huggingface/trl},
+  year    = {2020}
+}
+```

adapter_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "alora_invocation_tokens": null,
+  "alpha_pattern": {},
+  "arrow_config": null,
+  "auto_mapping": null,
+  "base_model_name_or_path": "google/medgemma-1.5-4b-it",
+  "bias": "none",
+  "corda_config": null,
+  "ensure_weight_tying": true,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 16,
+  "lora_bias": false,
+  "lora_dropout": 0.05,
+  "lora_ga_config": null,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": [
+    "embed_tokens",
+    "model.language_model.embed_tokens"
+  ],
+  "peft_type": "LORA",
+  "peft_version": "0.19.0",
+  "qalora_group_size": 16,
+  "r": 16,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "v_proj",
+    "fc1",
+    "q_proj",
+    "o_proj",
+    "out_proj",
+    "up_proj",
+    "down_proj",
+    "fc2",
+    "k_proj"
+  ],
+  "target_parameters": null,
+  "task_type": "CAUSAL_LM",
+  "trainable_token_indices": null,
+  "use_bdlora": null,
+  "use_dora": false,
+  "use_qalora": false,
+  "use_rslora": false
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd6e1d8f86a1ce09803bb2ba76201f9b23227bd7437e085732d4f3b9e5802eb5
+size 2762134176

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,47 @@

+{{ bos_token }}
+{%- if messages[0]['role'] == 'system' -%}
+    {%- if messages[0]['content'] is string -%}
+        {%- set first_user_prefix = messages[0]['content'] + '
+' -%}
+    {%- else -%}
+        {%- set first_user_prefix = messages[0]['content'][0]['text'] + '
+' -%}
+    {%- endif -%}
+    {%- set loop_messages = messages[1:] -%}
+{%- else -%}
+    {%- set first_user_prefix = "" -%}
+    {%- set loop_messages = messages -%}
+{%- endif -%}
+{%- for message in loop_messages -%}
+    {%- if (message['role'] == 'user') != (loop.index0 % 2 == 0) -%}
+        {{ raise_exception("Conversation roles must alternate user/assistant/user/assistant/...") }}
+    {%- endif -%}
+    {%- if (message['role'] == 'assistant') -%}
+        {%- set role = "model" -%}
+    {%- else -%}
+        {%- set role = message['role'] -%}
+    {%- endif -%}
+    {{ '<start_of_turn>' + role + '
+' + (first_user_prefix if loop.first else "") }}
+    {%- if message['content'] is string -%}
+        {{ message['content'] | trim }}
+    {%- elif message['content'] is iterable -%}
+        {%- for item in message['content'] -%}
+            {%- if item['type'] == 'image' -%}
+                {{ '<start_of_image>' }}
+            {%- elif item['type'] == 'text' -%}
+                {{ item['text'] | trim }}
+            {%- endif -%}
+        {%- endfor -%}
+    {%- else -%}
+        {{ raise_exception("Invalid content type") }}
+    {%- endif -%}
+    {{ '<end_of_turn>
+' }}
+{%- endfor -%}
+{%- if add_generation_prompt -%}
+    {{'<start_of_turn>model
+'}}
+{%- endif -%}

runs/Apr14_15-40-35_d5064a8e9c6f/events.out.tfevents.1776181235.d5064a8e9c6f.708.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e83b0ae41f4198fd9a7c703aac2b3598744e509a20f38395ee38e9856c969d83
+size 7541

runs/Apr14_15-49-28_d5064a8e9c6f/events.out.tfevents.1776181768.d5064a8e9c6f.1029.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1947b5c3e08e828688b4b473923ce1d8d56c18f23c5b659878febabc1460d0ef
+size 7541

runs/Apr14_16-19-28_d5064a8e9c6f/events.out.tfevents.1776183568.d5064a8e9c6f.1695.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e860ab090d8ddb8d67d3ae3c26794a3280dd962c365962229d5984ac466e9c2f
+size 7551

runs/Apr14_16-32-05_d5064a8e9c6f/events.out.tfevents.1776184325.d5064a8e9c6f.1922.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ad2544170294f590624ab8f2d5e6e1322efbc941bc0234113bd9e87e7fa9fdba
+size 7551

runs/Apr14_16-43-40_d5064a8e9c6f/events.out.tfevents.1776185020.d5064a8e9c6f.2145.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81234bb7a379679c939871067365f58b3938bd39506f31b3dd287a14b703b740
+size 7551

runs/Apr14_16-50-43_d5064a8e9c6f/events.out.tfevents.1776185443.d5064a8e9c6f.2371.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:106013d7cf1d0f598545c156d2f6036c109fdd738305cedcd4abb4fa26e7f5ec
+size 8356

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:daab2354f8a74e70d70b4d1f804939b68a8c9624dd06cb7858e52dd8970e9726
+size 33384567

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "backend": "tokenizers",
+  "boi_token": "<start_of_image>",
+  "bos_token": "<bos>",
+  "clean_up_tokenization_spaces": false,
+  "eoi_token": "<end_of_image>",
+  "eos_token": "<eos>",
+  "image_token": "<image_soft_token>",
+  "is_local": false,
+  "mask_token": "<mask>",
+  "model_max_length": 1000000000000000019884624838656,
+  "model_specific_special_tokens": {
+    "boi_token": "<start_of_image>",
+    "eoi_token": "<end_of_image>",
+    "image_token": "<image_soft_token>"
+  },
+  "pad_token": "<pad>",
+  "padding_side": "left",
+  "processor_class": "Gemma3Processor",
+  "sp_model_kwargs": null,
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "GemmaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f5e44f16de26fc33bc5cf75c5f775e8d68d94346a57f0dfd28f1af55b20396e
+size 5713