StyleDistance
/

styledistance

Sentence Similarity

sentence-transformers

datadreamer-0.35.0

feature-extraction

text-embeddings-inference

Model card Files Files and versions

AjayP13 commited on Jul 17, 2024

Commit

dd509f1

·

verified ·

1 Parent(s): dbe72de

Pushed by DataDreamer

Update training_args.json

Files changed (1) hide show

training_args.json +3 -3

training_args.json CHANGED Viewed

@@ -13,13 +13,13 @@
     "gradient_accumulation_steps": 1,
     "eval_accumulation_steps": 1,
     "eval_delay": 0,
-    "learning_rate": 0.001,
     "weight_decay": 0.01,
     "adam_beta1": 0.9,
     "adam_beta2": 0.999,
     "adam_epsilon": 1e-08,
     "max_grad_norm": 1.0,
-    "num_train_epochs": 1,
     "max_steps": -1,
     "lr_scheduler_type": "linear",
     "lr_scheduler_kwargs": {},
@@ -28,7 +28,7 @@
     "log_level": "passive",
     "log_level_replica": "warning",
     "log_on_each_node": true,
-    "logging_dir": "./output/train-styledistance-model/_checkpoints/runs/Jul17_08-19-41_nlpgpu04.seas.upenn.edu",
     "logging_strategy": "steps",
     "logging_first_step": false,
     "logging_steps": 1,

     "gradient_accumulation_steps": 1,
     "eval_accumulation_steps": 1,
     "eval_delay": 0,
+    "learning_rate": 0.0001,
     "weight_decay": 0.01,
     "adam_beta1": 0.9,
     "adam_beta2": 0.999,
     "adam_epsilon": 1e-08,
     "max_grad_norm": 1.0,
+    "num_train_epochs": 10,
     "max_steps": -1,
     "lr_scheduler_type": "linear",
     "lr_scheduler_kwargs": {},
     "log_level": "passive",
     "log_level_replica": "warning",
     "log_on_each_node": true,
+    "logging_dir": "./output/train-styledistance-model/_checkpoints/runs/Jul17_08-37-06_nlpgpu04.seas.upenn.edu",
     "logging_strategy": "steps",
     "logging_first_step": false,
     "logging_steps": 1,