MiniMedMind
/

checkpoint_MiniMedMind

Model card Files Files and versions

xet

Community

khanhduong commited on Oct 27, 2024

Commit

9c7c184

verified ·

1 Parent(s): 6946962

Upload 24_10_27_15_11_26_log.txt with huggingface_hub

Browse files

Files changed (1) hide show

24_10_27_15_11_26_log.txt +115 -0

24_10_27_15_11_26_log.txt ADDED Viewed

	@@ -0,0 +1,115 @@

+{
+    "run": {
+        "task": "image_text_pretrain",
+        "lr_sched": "linear_warmup_cosine_lr",
+        "init_lr": 3e-05,
+        "min_lr": 1e-05,
+        "warmup_lr": 1e-06,
+        "weight_decay": 0.05,
+        "max_epoch": 50,
+        "iters_per_epoch": 600,
+        "batch_size_train": 15,
+        "batch_size_eval": 1,
+        "num_workers": 4,
+        "warmup_steps": 200,
+        "seed": 42,
+        "output_dir": "output/xraygpt_vqa_finetune",
+        "amp": true,
+        "resume_ckpt_path": null,
+        "evaluate": false,
+        "train_splits": [
+            "train"
+        ],
+        "device": "cuda",
+        "world_size": 2,
+        "dist_url": "env://",
+        "distributed": true,
+        "rank": 0,
+        "gpu": 0,
+        "dist_backend": "nccl"
+    },
+    "model": {
+        "arch": "mini_gpt4",
+        "image_size": 224,
+        "drop_path_rate": 0,
+        "use_grad_checkpoint": false,
+        "vit_precision": "fp16",
+        "freeze_vit": true,
+        "freeze_qformer": true,
+        "num_query_token": 32,
+        "llama_model": "Joycean0301/Llama-3.2-3B-Instruct-Medical-Conversational",
+        "prompt": "",
+        "lora_r": 16,
+        "lora_alpha": 16,
+        "lora_target_modules": [
+            "q_proj",
+            "k_proj",
+            "v_proj",
+            "o_proj",
+            "gate_proj",
+            "up_proj",
+            "down_proj"
+        ],
+        "lora_dropout": 0.1,
+        "lora_bias": "none",
+        "model_type": "pretrain_vicuna",
+        "max_txt_len": 160,
+        "end_sym": "<|eot_id|>",
+        "ckpt": "24_10_26_14_03_09_pretrain100_finetune2_lora_openi.pth"
+    },
+    "preprocess": {
+        "vis_processor": {
+            "train": {
+                "name": "blip2_image_train",
+                "image_size": 224
+            },
+            "eval": {
+                "name": "blip2_image_eval",
+                "image_size": 224
+            }
+        },
+        "text_processor": {
+            "train": {
+                "name": "blip_caption"
+            },
+            "eval": {
+                "name": "blip_caption"
+            }
+        }
+    },
+    "datasets": {
+        "vqa": {
+            "data_type": "images",
+            "build_info": {
+                "storage": "dataset/llava_med_60k_instruct"
+            },
+            "vis_processor": {
+                "train": {
+                    "name": "blip2_image_train",
+                    "image_size": 224
+                }
+            },
+            "text_processor": {
+                "train": {
+                    "name": "blip_caption"
+                }
+            }
+        }
+    }
+}
+{"train_lr": "0.000025", "train_loss": "1.129822"}
+{"train_lr": "0.000030", "train_loss": "0.771452"}
+{"train_lr": "0.000030", "train_loss": "0.699119"}
+{"train_lr": "0.000030", "train_loss": "0.650587"}
+{"train_lr": "0.000030", "train_loss": "0.610647"}
+{"train_lr": "0.000029", "train_loss": "0.574458"}
+{"train_lr": "0.000029", "train_loss": "0.542380"}
+{"train_lr": "0.000029", "train_loss": "0.509769"}
+{"train_lr": "0.000029", "train_loss": "0.478779"}
+{"train_lr": "0.000028", "train_loss": "0.448832"}
+{"train_lr": "0.000028", "train_loss": "0.420626"}
+{"train_lr": "0.000028", "train_loss": "0.389205"}
+{"train_lr": "0.000027", "train_loss": "0.360322"}
+{"train_lr": "0.000027", "train_loss": "0.331934"}
+{"train_lr": "0.000026", "train_loss": "0.303854"}
+{"train_lr": "0.000026", "train_loss": "0.276897"}