qianjiaying commited on Apr 20, 2023

Commit

9d88a96

1 Parent(s): 5abeb01

upload

Browse files

Files changed (22) hide show

model/.DS_Store +0 -0
model/my-unsup-simcse-bert-base-uncased-0413/config.json +24 -0
model/my-unsup-simcse-bert-base-uncased-0413/optimizer.pt +3 -0
model/my-unsup-simcse-bert-base-uncased-0413/pytorch_model.bin +3 -0
model/my-unsup-simcse-bert-base-uncased-0413/scheduler.pt +3 -0
model/my-unsup-simcse-bert-base-uncased-0413/special_tokens_map.json +1 -0
model/my-unsup-simcse-bert-base-uncased-0413/tokenizer_config.json +1 -0
model/my-unsup-simcse-bert-base-uncased-0413/trainer_state.json +741 -0
model/my-unsup-simcse-bert-base-uncased-0413/training_args.bin +3 -0
model/my-unsup-simcse-bert-base-uncased-0413/vocab.txt +0 -0
model/my-unsup-simcse-bert-base-uncased_ori/config.json +26 -0
model/my-unsup-simcse-bert-base-uncased_ori/merges.txt +0 -0
model/my-unsup-simcse-bert-base-uncased_ori/optimizer.pt +3 -0
model/my-unsup-simcse-bert-base-uncased_ori/pytorch_model.bin +3 -0
model/my-unsup-simcse-bert-base-uncased_ori/scheduler.pt +3 -0
model/my-unsup-simcse-bert-base-uncased_ori/special_tokens_map.json +1 -0
model/my-unsup-simcse-bert-base-uncased_ori/tokenizer_config.json +1 -0
model/my-unsup-simcse-bert-base-uncased_ori/train_results.txt +3 -0
model/my-unsup-simcse-bert-base-uncased_ori/trainer_state.json +44 -0
model/my-unsup-simcse-bert-base-uncased_ori/training_args.bin +3 -0
model/my-unsup-simcse-bert-base-uncased_ori/vocab.json +0 -0
model/my-unsup-simcse-bert-base-uncased_ori/vocab.txt +0 -0

model/.DS_Store ADDED Viewed

Binary file (8.2 kB). View file

model/my-unsup-simcse-bert-base-uncased-0413/config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertForCL"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.2.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

model/my-unsup-simcse-bert-base-uncased-0413/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7fe0a42b6c6994f10fd145e4cc4141592b3d6f0ad929d39c3c44f9f7c6e8c5d1
+size 875974661

model/my-unsup-simcse-bert-base-uncased-0413/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97cea0b156dd8b46dcdda7a4b9b9be70ca097d43b955fcc4770c6e00b3ec4c18
+size 438014253

model/my-unsup-simcse-bert-base-uncased-0413/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2ede01415a15a84a2fcc3aa958983b10cddb77be0e10206cc7e73b7b95df800
+size 627

model/my-unsup-simcse-bert-base-uncased-0413/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

model/my-unsup-simcse-bert-base-uncased-0413/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"do_lower_case": true, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "model_max_length": 512, "name_or_path": "bert-base-uncased"}

model/my-unsup-simcse-bert-base-uncased-0413/trainer_state.json ADDED Viewed

	@@ -0,0 +1,741 @@

+{
+  "best_metric": 0.5772300834060221,
+  "best_model_checkpoint": "result/my-unsup-simcse-bert-base-uncased-0413",
+  "epoch": 1.1541953054078589,
+  "global_step": 8900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "eval_avg_sts": 0.43413417287570444,
+      "eval_sickr_spearman": 0.4582097432098862,
+      "eval_stsb_spearman": 0.4100586025415227,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "eval_avg_sts": 0.44202934238660074,
+      "eval_sickr_spearman": 0.46371670111417157,
+      "eval_stsb_spearman": 0.42034198365902986,
+      "step": 200
+    },
+    {
+      "epoch": 0.04,
+      "eval_avg_sts": 0.45392676705884744,
+      "eval_sickr_spearman": 0.4647000418539141,
+      "eval_stsb_spearman": 0.44315349226378076,
+      "step": 300
+    },
+    {
+      "epoch": 0.05,
+      "eval_avg_sts": 0.46705471818431266,
+      "eval_sickr_spearman": 0.4777946649767838,
+      "eval_stsb_spearman": 0.4563147713918415,
+      "step": 400
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.783858557039727e-06,
+      "loss": 0.0626,
+      "step": 500
+    },
+    {
+      "epoch": 0.06,
+      "eval_avg_sts": 0.4629420855704067,
+      "eval_sickr_spearman": 0.472255862452245,
+      "eval_stsb_spearman": 0.4536283086885684,
+      "step": 500
+    },
+    {
+      "epoch": 0.08,
+      "eval_avg_sts": 0.4583178800945026,
+      "eval_sickr_spearman": 0.4685936350608932,
+      "eval_stsb_spearman": 0.4480421251281119,
+      "step": 600
+    },
+    {
+      "epoch": 0.09,
+      "eval_avg_sts": 0.46463274114411685,
+      "eval_sickr_spearman": 0.4777823209837142,
+      "eval_stsb_spearman": 0.4514831613045195,
+      "step": 700
+    },
+    {
+      "epoch": 0.1,
+      "eval_avg_sts": 0.4757360446446461,
+      "eval_sickr_spearman": 0.4900823655954934,
+      "eval_stsb_spearman": 0.46138972369379877,
+      "step": 800
+    },
+    {
+      "epoch": 0.12,
+      "eval_avg_sts": 0.4706008129820051,
+      "eval_sickr_spearman": 0.4842226672822465,
+      "eval_stsb_spearman": 0.45697895868176375,
+      "step": 900
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 9.567717114079454e-06,
+      "loss": 0.006,
+      "step": 1000
+    },
+    {
+      "epoch": 0.13,
+      "eval_avg_sts": 0.4724716705172539,
+      "eval_sickr_spearman": 0.4847777627215667,
+      "eval_stsb_spearman": 0.4601655783129412,
+      "step": 1000
+    },
+    {
+      "epoch": 0.14,
+      "eval_avg_sts": 0.46868978609741097,
+      "eval_sickr_spearman": 0.4790444342362035,
+      "eval_stsb_spearman": 0.4583351379586184,
+      "step": 1100
+    },
+    {
+      "epoch": 0.16,
+      "eval_avg_sts": 0.4739309502400343,
+      "eval_sickr_spearman": 0.4857525539252532,
+      "eval_stsb_spearman": 0.46210934655481545,
+      "step": 1200
+    },
+    {
+      "epoch": 0.17,
+      "eval_avg_sts": 0.47321307094316606,
+      "eval_sickr_spearman": 0.4839474971021075,
+      "eval_stsb_spearman": 0.4624786447842246,
+      "step": 1300
+    },
+    {
+      "epoch": 0.18,
+      "eval_avg_sts": 0.476232403795022,
+      "eval_sickr_spearman": 0.4853778633029345,
+      "eval_stsb_spearman": 0.46708694428710956,
+      "step": 1400
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.35157567111918e-06,
+      "loss": 0.0048,
+      "step": 1500
+    },
+    {
+      "epoch": 0.19,
+      "eval_avg_sts": 0.4671866652183253,
+      "eval_sickr_spearman": 0.47849875289276517,
+      "eval_stsb_spearman": 0.45587457754388544,
+      "step": 1500
+    },
+    {
+      "epoch": 0.21,
+      "eval_avg_sts": 0.4719700135797812,
+      "eval_sickr_spearman": 0.48377895596716125,
+      "eval_stsb_spearman": 0.46016107119240107,
+      "step": 1600
+    },
+    {
+      "epoch": 0.22,
+      "eval_avg_sts": 0.468405693803544,
+      "eval_sickr_spearman": 0.47872507544274157,
+      "eval_stsb_spearman": 0.45808631216434653,
+      "step": 1700
+    },
+    {
+      "epoch": 0.23,
+      "eval_avg_sts": 0.4693147295623183,
+      "eval_sickr_spearman": 0.4841435120270765,
+      "eval_stsb_spearman": 0.4544859470975601,
+      "step": 1800
+    },
+    {
+      "epoch": 0.25,
+      "eval_avg_sts": 0.4756334603907184,
+      "eval_sickr_spearman": 0.4869564054516981,
+      "eval_stsb_spearman": 0.46431051532973877,
+      "step": 1900
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 9.135434228158908e-06,
+      "loss": 0.0039,
+      "step": 2000
+    },
+    {
+      "epoch": 0.26,
+      "eval_avg_sts": 0.47879461277752494,
+      "eval_sickr_spearman": 0.4944859050064409,
+      "eval_stsb_spearman": 0.463103320548609,
+      "step": 2000
+    },
+    {
+      "epoch": 0.27,
+      "eval_avg_sts": 0.4919587799046121,
+      "eval_sickr_spearman": 0.50618844271633,
+      "eval_stsb_spearman": 0.47772911709289423,
+      "step": 2100
+    },
+    {
+      "epoch": 0.29,
+      "eval_avg_sts": 0.4920605376671945,
+      "eval_sickr_spearman": 0.5040317021684543,
+      "eval_stsb_spearman": 0.48008937316593464,
+      "step": 2200
+    },
+    {
+      "epoch": 0.3,
+      "eval_avg_sts": 0.5061405516094162,
+      "eval_sickr_spearman": 0.515380875065063,
+      "eval_stsb_spearman": 0.4969002281537693,
+      "step": 2300
+    },
+    {
+      "epoch": 0.31,
+      "eval_avg_sts": 0.49937347650708863,
+      "eval_sickr_spearman": 0.5125618336594574,
+      "eval_stsb_spearman": 0.48618511935471986,
+      "step": 2400
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.919292785198635e-06,
+      "loss": 0.0036,
+      "step": 2500
+    },
+    {
+      "epoch": 0.32,
+      "eval_avg_sts": 0.5097962418074036,
+      "eval_sickr_spearman": 0.5162478844771226,
+      "eval_stsb_spearman": 0.5033445991376845,
+      "step": 2500
+    },
+    {
+      "epoch": 0.34,
+      "eval_avg_sts": 0.5038287826668915,
+      "eval_sickr_spearman": 0.5139890778386909,
+      "eval_stsb_spearman": 0.4936684874950922,
+      "step": 2600
+    },
+    {
+      "epoch": 0.35,
+      "eval_avg_sts": 0.4876245229950539,
+      "eval_sickr_spearman": 0.503567481573055,
+      "eval_stsb_spearman": 0.4716815644170527,
+      "step": 2700
+    },
+    {
+      "epoch": 0.36,
+      "eval_avg_sts": 0.48852558904470145,
+      "eval_sickr_spearman": 0.5041236336966068,
+      "eval_stsb_spearman": 0.472927544392796,
+      "step": 2800
+    },
+    {
+      "epoch": 0.38,
+      "eval_avg_sts": 0.4908887011823253,
+      "eval_sickr_spearman": 0.506046366718276,
+      "eval_stsb_spearman": 0.4757310356463747,
+      "step": 2900
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 8.703151342238363e-06,
+      "loss": 0.0031,
+      "step": 3000
+    },
+    {
+      "epoch": 0.39,
+      "eval_avg_sts": 0.49885341513488746,
+      "eval_sickr_spearman": 0.5072558859146905,
+      "eval_stsb_spearman": 0.49045094435508446,
+      "step": 3000
+    },
+    {
+      "epoch": 0.4,
+      "eval_avg_sts": 0.5025732287061541,
+      "eval_sickr_spearman": 0.5157659404052926,
+      "eval_stsb_spearman": 0.4893805170070156,
+      "step": 3100
+    },
+    {
+      "epoch": 0.41,
+      "eval_avg_sts": 0.48566033454734003,
+      "eval_sickr_spearman": 0.5039478878964448,
+      "eval_stsb_spearman": 0.4673727811982352,
+      "step": 3200
+    },
+    {
+      "epoch": 0.43,
+      "eval_avg_sts": 0.47697364115308033,
+      "eval_sickr_spearman": 0.497832856247953,
+      "eval_stsb_spearman": 0.4561144260582077,
+      "step": 3300
+    },
+    {
+      "epoch": 0.44,
+      "eval_avg_sts": 0.4905299355880675,
+      "eval_sickr_spearman": 0.5084222731820136,
+      "eval_stsb_spearman": 0.4726375979941214,
+      "step": 3400
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 8.487009899278088e-06,
+      "loss": 0.0026,
+      "step": 3500
+    },
+    {
+      "epoch": 0.45,
+      "eval_avg_sts": 0.4927153870008586,
+      "eval_sickr_spearman": 0.5115589442614296,
+      "eval_stsb_spearman": 0.4738718297402876,
+      "step": 3500
+    },
+    {
+      "epoch": 0.47,
+      "eval_avg_sts": 0.4990059371177902,
+      "eval_sickr_spearman": 0.5237218120475015,
+      "eval_stsb_spearman": 0.47429006218807884,
+      "step": 3600
+    },
+    {
+      "epoch": 0.48,
+      "eval_avg_sts": 0.5081240005291581,
+      "eval_sickr_spearman": 0.5338321187447169,
+      "eval_stsb_spearman": 0.4824158823135992,
+      "step": 3700
+    },
+    {
+      "epoch": 0.49,
+      "eval_avg_sts": 0.5053613131195629,
+      "eval_sickr_spearman": 0.5345850062597594,
+      "eval_stsb_spearman": 0.4761376199793665,
+      "step": 3800
+    },
+    {
+      "epoch": 0.51,
+      "eval_avg_sts": 0.5291853264881973,
+      "eval_sickr_spearman": 0.5583114097481583,
+      "eval_stsb_spearman": 0.5000592432282362,
+      "step": 3900
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 8.270868456317816e-06,
+      "loss": 0.0043,
+      "step": 4000
+    },
+    {
+      "epoch": 0.52,
+      "eval_avg_sts": 0.5303577078371549,
+      "eval_sickr_spearman": 0.555212106865661,
+      "eval_stsb_spearman": 0.5055033088086488,
+      "step": 4000
+    },
+    {
+      "epoch": 0.53,
+      "eval_avg_sts": 0.5333661650982712,
+      "eval_sickr_spearman": 0.5605562393360713,
+      "eval_stsb_spearman": 0.506176090860471,
+      "step": 4100
+    },
+    {
+      "epoch": 0.54,
+      "eval_avg_sts": 0.5278812963738058,
+      "eval_sickr_spearman": 0.5576400310122562,
+      "eval_stsb_spearman": 0.49812256173535524,
+      "step": 4200
+    },
+    {
+      "epoch": 0.56,
+      "eval_avg_sts": 0.5228114162776825,
+      "eval_sickr_spearman": 0.549996457591598,
+      "eval_stsb_spearman": 0.495626374963767,
+      "step": 4300
+    },
+    {
+      "epoch": 0.57,
+      "eval_avg_sts": 0.5249527931181994,
+      "eval_sickr_spearman": 0.5511832580770323,
+      "eval_stsb_spearman": 0.4987223281593667,
+      "step": 4400
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 8.054727013357542e-06,
+      "loss": 0.0024,
+      "step": 4500
+    },
+    {
+      "epoch": 0.58,
+      "eval_avg_sts": 0.5365941902025078,
+      "eval_sickr_spearman": 0.5552903014988024,
+      "eval_stsb_spearman": 0.5178980789062131,
+      "step": 4500
+    },
+    {
+      "epoch": 0.6,
+      "eval_avg_sts": 0.5347280260801861,
+      "eval_sickr_spearman": 0.5567227330369913,
+      "eval_stsb_spearman": 0.5127333191233809,
+      "step": 4600
+    },
+    {
+      "epoch": 0.61,
+      "eval_avg_sts": 0.5353743763935372,
+      "eval_sickr_spearman": 0.5572790772849489,
+      "eval_stsb_spearman": 0.5134696755021255,
+      "step": 4700
+    },
+    {
+      "epoch": 0.62,
+      "eval_avg_sts": 0.5372262235055488,
+      "eval_sickr_spearman": 0.557209576281168,
+      "eval_stsb_spearman": 0.5172428707299297,
+      "step": 4800
+    },
+    {
+      "epoch": 0.64,
+      "eval_avg_sts": 0.5392746843345577,
+      "eval_sickr_spearman": 0.5658935994211787,
+      "eval_stsb_spearman": 0.5126557692479369,
+      "step": 4900
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 7.83858557039727e-06,
+      "loss": 0.0035,
+      "step": 5000
+    },
+    {
+      "epoch": 0.65,
+      "eval_avg_sts": 0.5381467627451588,
+      "eval_sickr_spearman": 0.5665912992006686,
+      "eval_stsb_spearman": 0.5097022262896491,
+      "step": 5000
+    },
+    {
+      "epoch": 0.66,
+      "eval_avg_sts": 0.5437598393325787,
+      "eval_sickr_spearman": 0.5716501269285366,
+      "eval_stsb_spearman": 0.5158695517366209,
+      "step": 5100
+    },
+    {
+      "epoch": 0.67,
+      "eval_avg_sts": 0.5458859184475997,
+      "eval_sickr_spearman": 0.5727973978174873,
+      "eval_stsb_spearman": 0.5189744390777121,
+      "step": 5200
+    },
+    {
+      "epoch": 0.69,
+      "eval_avg_sts": 0.5471436350834367,
+      "eval_sickr_spearman": 0.5750997686649232,
+      "eval_stsb_spearman": 0.5191875015019501,
+      "step": 5300
+    },
+    {
+      "epoch": 0.7,
+      "eval_avg_sts": 0.5362576150135143,
+      "eval_sickr_spearman": 0.5684171054596358,
+      "eval_stsb_spearman": 0.504098124567393,
+      "step": 5400
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 7.622444127436995e-06,
+      "loss": 0.0021,
+      "step": 5500
+    },
+    {
+      "epoch": 0.71,
+      "eval_avg_sts": 0.5439797124533817,
+      "eval_sickr_spearman": 0.5719825982126912,
+      "eval_stsb_spearman": 0.5159768266940723,
+      "step": 5500
+    },
+    {
+      "epoch": 0.73,
+      "eval_avg_sts": 0.5336924618718794,
+      "eval_sickr_spearman": 0.5533836108650136,
+      "eval_stsb_spearman": 0.5140013128787451,
+      "step": 5600
+    },
+    {
+      "epoch": 0.74,
+      "eval_avg_sts": 0.5432756107135348,
+      "eval_sickr_spearman": 0.5664231903456354,
+      "eval_stsb_spearman": 0.5201280310814343,
+      "step": 5700
+    },
+    {
+      "epoch": 0.75,
+      "eval_avg_sts": 0.5362600896652556,
+      "eval_sickr_spearman": 0.5664119990990002,
+      "eval_stsb_spearman": 0.5061081802315109,
+      "step": 5800
+    },
+    {
+      "epoch": 0.77,
+      "eval_avg_sts": 0.5558055193441328,
+      "eval_sickr_spearman": 0.5845013764604193,
+      "eval_stsb_spearman": 0.5271096622278463,
+      "step": 5900
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 7.406302684476722e-06,
+      "loss": 0.0029,
+      "step": 6000
+    },
+    {
+      "epoch": 0.78,
+      "eval_avg_sts": 0.5543715317449052,
+      "eval_sickr_spearman": 0.582216825151617,
+      "eval_stsb_spearman": 0.5265262383381932,
+      "step": 6000
+    },
+    {
+      "epoch": 0.79,
+      "eval_avg_sts": 0.5577833334850189,
+      "eval_sickr_spearman": 0.5861351063447354,
+      "eval_stsb_spearman": 0.5294315606253022,
+      "step": 6100
+    },
+    {
+      "epoch": 0.8,
+      "eval_avg_sts": 0.5459303241614681,
+      "eval_sickr_spearman": 0.5734108990761563,
+      "eval_stsb_spearman": 0.5184497492467801,
+      "step": 6200
+    },
+    {
+      "epoch": 0.82,
+      "eval_avg_sts": 0.5527974603364145,
+      "eval_sickr_spearman": 0.5769931546836136,
+      "eval_stsb_spearman": 0.5286017659892155,
+      "step": 6300
+    },
+    {
+      "epoch": 0.83,
+      "eval_avg_sts": 0.5613325719571378,
+      "eval_sickr_spearman": 0.5828151485822315,
+      "eval_stsb_spearman": 0.5398499953320443,
+      "step": 6400
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 7.190161241516449e-06,
+      "loss": 0.0013,
+      "step": 6500
+    },
+    {
+      "epoch": 0.84,
+      "eval_avg_sts": 0.5706535000902035,
+      "eval_sickr_spearman": 0.5902679904990792,
+      "eval_stsb_spearman": 0.5510390096813279,
+      "step": 6500
+    },
+    {
+      "epoch": 0.86,
+      "eval_avg_sts": 0.5588971829128009,
+      "eval_sickr_spearman": 0.5792282339579348,
+      "eval_stsb_spearman": 0.5385661318676669,
+      "step": 6600
+    },
+    {
+      "epoch": 0.87,
+      "eval_avg_sts": 0.5467875739347965,
+      "eval_sickr_spearman": 0.5713499805756498,
+      "eval_stsb_spearman": 0.5222251672939431,
+      "step": 6700
+    },
+    {
+      "epoch": 0.88,
+      "eval_avg_sts": 0.5564259742453666,
+      "eval_sickr_spearman": 0.5743576881477043,
+      "eval_stsb_spearman": 0.5384942603430287,
+      "step": 6800
+    },
+    {
+      "epoch": 0.89,
+      "eval_avg_sts": 0.564484253954618,
+      "eval_sickr_spearman": 0.5855938918937308,
+      "eval_stsb_spearman": 0.5433746160155053,
+      "step": 6900
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 6.974019798556175e-06,
+      "loss": 0.0046,
+      "step": 7000
+    },
+    {
+      "epoch": 0.91,
+      "eval_avg_sts": 0.5572693279756483,
+      "eval_sickr_spearman": 0.5816440542669675,
+      "eval_stsb_spearman": 0.5328946016843291,
+      "step": 7000
+    },
+    {
+      "epoch": 0.92,
+      "eval_avg_sts": 0.5564053626625001,
+      "eval_sickr_spearman": 0.5780550262742075,
+      "eval_stsb_spearman": 0.5347556990507928,
+      "step": 7100
+    },
+    {
+      "epoch": 0.93,
+      "eval_avg_sts": 0.5595700328398423,
+      "eval_sickr_spearman": 0.5775588169652502,
+      "eval_stsb_spearman": 0.5415812487144344,
+      "step": 7200
+    },
+    {
+      "epoch": 0.95,
+      "eval_avg_sts": 0.5507423483095826,
+      "eval_sickr_spearman": 0.5766743242322674,
+      "eval_stsb_spearman": 0.5248103723868978,
+      "step": 7300
+    },
+    {
+      "epoch": 0.96,
+      "eval_avg_sts": 0.5496315444386322,
+      "eval_sickr_spearman": 0.5782933085684419,
+      "eval_stsb_spearman": 0.5209697803088224,
+      "step": 7400
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 6.7578783555959026e-06,
+      "loss": 0.0029,
+      "step": 7500
+    },
+    {
+      "epoch": 0.97,
+      "eval_avg_sts": 0.5654071055800436,
+      "eval_sickr_spearman": 0.5835302836515436,
+      "eval_stsb_spearman": 0.5472839275085436,
+      "step": 7500
+    },
+    {
+      "epoch": 0.99,
+      "eval_avg_sts": 0.5573712317131654,
+      "eval_sickr_spearman": 0.5770115986265659,
+      "eval_stsb_spearman": 0.5377308647997648,
+      "step": 7600
+    },
+    {
+      "epoch": 1.0,
+      "eval_avg_sts": 0.561124258264991,
+      "eval_sickr_spearman": 0.5816098080916421,
+      "eval_stsb_spearman": 0.5406387084383399,
+      "step": 7700
+    },
+    {
+      "epoch": 1.01,
+      "eval_avg_sts": 0.5704081137772914,
+      "eval_sickr_spearman": 0.592072951260022,
+      "eval_stsb_spearman": 0.5487432762945608,
+      "step": 7800
+    },
+    {
+      "epoch": 1.02,
+      "eval_avg_sts": 0.5742201136812924,
+      "eval_sickr_spearman": 0.5966417656910182,
+      "eval_stsb_spearman": 0.5517984616715667,
+      "step": 7900
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 6.541736912635629e-06,
+      "loss": 0.0041,
+      "step": 8000
+    },
+    {
+      "epoch": 1.04,
+      "eval_avg_sts": 0.578527273351308,
+      "eval_sickr_spearman": 0.6026895057663952,
+      "eval_stsb_spearman": 0.5543650409362207,
+      "step": 8000
+    },
+    {
+      "epoch": 1.05,
+      "eval_avg_sts": 0.5874722846001152,
+      "eval_sickr_spearman": 0.6127884771236713,
+      "eval_stsb_spearman": 0.5621560920765593,
+      "step": 8100
+    },
+    {
+      "epoch": 1.06,
+      "eval_avg_sts": 0.5832344728360276,
+      "eval_sickr_spearman": 0.6076356044991877,
+      "eval_stsb_spearman": 0.5588333411728674,
+      "step": 8200
+    },
+    {
+      "epoch": 1.08,
+      "eval_avg_sts": 0.5855265282675808,
+      "eval_sickr_spearman": 0.6116178150883202,
+      "eval_stsb_spearman": 0.5594352414468413,
+      "step": 8300
+    },
+    {
+      "epoch": 1.09,
+      "eval_avg_sts": 0.5773281021616433,
+      "eval_sickr_spearman": 0.6021348906380893,
+      "eval_stsb_spearman": 0.5525213136851973,
+      "step": 8400
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 6.325595469675356e-06,
+      "loss": 0.0034,
+      "step": 8500
+    },
+    {
+      "epoch": 1.1,
+      "eval_avg_sts": 0.5733092691598134,
+      "eval_sickr_spearman": 0.598557342078573,
+      "eval_stsb_spearman": 0.5480611962410536,
+      "step": 8500
+    },
+    {
+      "epoch": 1.12,
+      "eval_avg_sts": 0.5735029071550635,
+      "eval_sickr_spearman": 0.5968002683257639,
+      "eval_stsb_spearman": 0.5502055459843631,
+      "step": 8600
+    },
+    {
+      "epoch": 1.13,
+      "eval_avg_sts": 0.5851313052653937,
+      "eval_sickr_spearman": 0.6086310971075941,
+      "eval_stsb_spearman": 0.5616315134231933,
+      "step": 8700
+    },
+    {
+      "epoch": 1.14,
+      "eval_avg_sts": 0.5914101664574409,
+      "eval_sickr_spearman": 0.6088285529656062,
+      "eval_stsb_spearman": 0.5739917799492756,
+      "step": 8800
+    },
+    {
+      "epoch": 1.15,
+      "eval_avg_sts": 0.5948432200811302,
+      "eval_sickr_spearman": 0.6124563567562383,
+      "eval_stsb_spearman": 0.5772300834060221,
+      "step": 8900
+    }
+  ],
+  "max_steps": 23133,
+  "num_train_epochs": 3,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": null
+}

model/my-unsup-simcse-bert-base-uncased-0413/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd222bfb9c26b00bdd9e473783a9c2007e0baf100da40fb19c324977569aa06b
+size 2171

model/my-unsup-simcse-bert-base-uncased-0413/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model/my-unsup-simcse-bert-base-uncased_ori/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForCL"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.2.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

model/my-unsup-simcse-bert-base-uncased_ori/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model/my-unsup-simcse-bert-base-uncased_ori/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d90ba75920b945193134035ade9fb71cf9af547549831752edbe17c72f0b4ff
+size 997281797

model/my-unsup-simcse-bert-base-uncased_ori/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29f3ec6385de50439bcc848c54dbeffe904d2e8d9d503c1eb1ad40d49437b75b
+size 498669037

model/my-unsup-simcse-bert-base-uncased_ori/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1522b9247a289f4d0d155e0bbe7375547292a9040940f809c7eb3c8cec5b56bf
+size 627

model/my-unsup-simcse-bert-base-uncased_ori/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": false}}

model/my-unsup-simcse-bert-base-uncased_ori/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "bos_token": "<s>", "eos_token": "</s>", "add_prefix_space": false, "errors": "replace", "sep_token": "</s>", "cls_token": "<s>", "pad_token": "<pad>", "mask_token": "<mask>", "model_max_length": 512, "name_or_path": "roberta-base"}

model/my-unsup-simcse-bert-base-uncased_ori/train_results.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+epoch = 3.0
+train_runtime = 763.7936
+train_samples_per_second = 1.261

model/my-unsup-simcse-bert-base-uncased_ori/trainer_state.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "best_metric": 0.7830865408035854,
+  "best_model_checkpoint": "result/my-unsup-simcse-bert-base-uncased",
+  "epoch": 0.62402496099844,
+  "global_step": 400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.16,
+      "eval_avg_sts": 0.7354961861232879,
+      "eval_sickr_spearman": 0.6918233183223756,
+      "eval_stsb_spearman": 0.7791690539242002,
+      "step": 100
+    },
+    {
+      "epoch": 0.31,
+      "eval_avg_sts": 0.7392649185824722,
+      "eval_sickr_spearman": 0.7019525973046593,
+      "eval_stsb_spearman": 0.7765772398602853,
+      "step": 200
+    },
+    {
+      "epoch": 0.47,
+      "eval_avg_sts": 0.7348363506865718,
+      "eval_sickr_spearman": 0.6903618759989183,
+      "eval_stsb_spearman": 0.7793108253742252,
+      "step": 300
+    },
+    {
+      "epoch": 0.62,
+      "eval_avg_sts": 0.7360856589231828,
+      "eval_sickr_spearman": 0.6890847770427803,
+      "eval_stsb_spearman": 0.7830865408035854,
+      "step": 400
+    }
+  ],
+  "max_steps": 1923,
+  "num_train_epochs": 3,
+  "total_flos": 0,
+  "trial_name": null,
+  "trial_params": null
+}

model/my-unsup-simcse-bert-base-uncased_ori/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aa113111f5a68f9866ca380fbcb100457fb0a5f72e4c85cd5385220044e1e55
+size 2107

model/my-unsup-simcse-bert-base-uncased_ori/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

model/my-unsup-simcse-bert-base-uncased_ori/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff