Model save

Browse files

Files changed (3) hide show

README.md +72 -0
model.safetensors +1 -1
trainer_state.json +179 -0

README.md ADDED Viewed

	@@ -0,0 +1,72 @@

+---
+library_name: transformers
+license: mit
+base_model: google/vivit-b-16x2-kinetics400
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: ViViT_lsa64_coR
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# ViViT_lsa64_coR
+This model is a fine-tuned version of [google/vivit-b-16x2-kinetics400](https://huggingface.co/google/vivit-b-16x2-kinetics400) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0008
+- Accuracy: 1.0
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 2
+- eval_batch_size: 2
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 8
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- training_steps: 2880
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 12.7049       | 0.1   | 288  | 1.3316          | 0.8438   |
+| 1.4335        | 1.1   | 576  | 0.0854          | 0.9922   |
+| 0.0869        | 2.1   | 864  | 0.0054          | 1.0      |
+| 0.0225        | 3.1   | 1152 | 0.0021          | 1.0      |
+| 0.0057        | 4.1   | 1440 | 0.0012          | 1.0      |
+| 0.0038        | 5.1   | 1728 | 0.0010          | 1.0      |
+| 0.0024        | 6.1   | 2016 | 0.0008          | 1.0      |
+| 0.0016        | 7.1   | 2304 | 0.0008          | 1.0      |
+### Framework versions
+- Transformers 4.46.1
+- Pytorch 2.5.1+cu124
+- Datasets 3.1.0
+- Tokenizers 0.20.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f45f510109650f5c9936ed7ebefbaa225f6b8456357359a48d5654709c183a34
 size 354806104

 version https://git-lfs.github.com/spec/v1
+oid sha256:27a4e9d01fdd3c437e1750dc143c04b7bf5249b8ab5924c6d4b841535a09017f
 size 354806104

trainer_state.json ADDED Viewed

	@@ -0,0 +1,179 @@

+{
+  "best_metric": 1.0,
+  "best_model_checkpoint": "/media/cse/HDD/Shawon/shawon/10 fold timesformer/ViViT_lsa64_coR/checkpoint-864",
+  "epoch": 7.1,
+  "eval_steps": 500,
+  "global_step": 2304,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.1,
+      "grad_norm": 34.6246223449707,
+      "learning_rate": 4.930555555555556e-05,
+      "loss": 12.7049,
+      "step": 288
+    },
+    {
+      "epoch": 0.1,
+      "eval_accuracy": 0.84375,
+      "eval_loss": 1.3316307067871094,
+      "eval_runtime": 289.0213,
+      "eval_samples_per_second": 0.886,
+      "eval_steps_per_second": 0.443,
+      "step": 288
+    },
+    {
+      "epoch": 1.1,
+      "grad_norm": 1.3600924015045166,
+      "learning_rate": 4.4521604938271604e-05,
+      "loss": 1.4335,
+      "step": 576
+    },
+    {
+      "epoch": 1.1,
+      "eval_accuracy": 0.9921875,
+      "eval_loss": 0.08541239798069,
+      "eval_runtime": 353.5336,
+      "eval_samples_per_second": 0.724,
+      "eval_steps_per_second": 0.362,
+      "step": 576
+    },
+    {
+      "epoch": 2.1,
+      "grad_norm": 0.12772603332996368,
+      "learning_rate": 3.8966049382716055e-05,
+      "loss": 0.0869,
+      "step": 864
+    },
+    {
+      "epoch": 2.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.00544479675590992,
+      "eval_runtime": 303.6919,
+      "eval_samples_per_second": 0.843,
+      "eval_steps_per_second": 0.421,
+      "step": 864
+    },
+    {
+      "epoch": 3.1,
+      "grad_norm": 0.10945271700620651,
+      "learning_rate": 3.341049382716049e-05,
+      "loss": 0.0225,
+      "step": 1152
+    },
+    {
+      "epoch": 3.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.002123473212122917,
+      "eval_runtime": 394.5624,
+      "eval_samples_per_second": 0.649,
+      "eval_steps_per_second": 0.324,
+      "step": 1152
+    },
+    {
+      "epoch": 4.1,
+      "grad_norm": 0.0422612763941288,
+      "learning_rate": 2.785493827160494e-05,
+      "loss": 0.0057,
+      "step": 1440
+    },
+    {
+      "epoch": 4.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0011819098144769669,
+      "eval_runtime": 324.5781,
+      "eval_samples_per_second": 0.789,
+      "eval_steps_per_second": 0.394,
+      "step": 1440
+    },
+    {
+      "epoch": 5.1,
+      "grad_norm": 0.026100359857082367,
+      "learning_rate": 2.2299382716049384e-05,
+      "loss": 0.0038,
+      "step": 1728
+    },
+    {
+      "epoch": 5.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0009726639837026596,
+      "eval_runtime": 354.0444,
+      "eval_samples_per_second": 0.723,
+      "eval_steps_per_second": 0.362,
+      "step": 1728
+    },
+    {
+      "epoch": 6.1,
+      "grad_norm": 0.02095157280564308,
+      "learning_rate": 1.674382716049383e-05,
+      "loss": 0.0024,
+      "step": 2016
+    },
+    {
+      "epoch": 6.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0008304659277200699,
+      "eval_runtime": 359.9913,
+      "eval_samples_per_second": 0.711,
+      "eval_steps_per_second": 0.356,
+      "step": 2016
+    },
+    {
+      "epoch": 7.1,
+      "grad_norm": 0.028533462435007095,
+      "learning_rate": 1.1188271604938271e-05,
+      "loss": 0.0016,
+      "step": 2304
+    },
+    {
+      "epoch": 7.1,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0007986431010067463,
+      "eval_runtime": 294.083,
+      "eval_samples_per_second": 0.871,
+      "eval_steps_per_second": 0.435,
+      "step": 2304
+    },
+    {
+      "epoch": 7.1,
+      "step": 2304,
+      "total_flos": 4.72490560063663e+19,
+      "train_loss": 1.7826555360419054,
+      "train_runtime": 26105.5788,
+      "train_samples_per_second": 0.883,
+      "train_steps_per_second": 0.11
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 2880,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 5
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 4.72490560063663e+19,
+  "train_batch_size": 2,
+  "trial_name": null,
+  "trial_params": null
+}