Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

config.json +59 -0
eval_results.txt +190 -0
model.safetensors +3 -0
tokenizer.json +0 -0
tokenizer_config.json +19 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "is_decoder": false,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_2": 2,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 8194,
+  "model_type": "roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.0.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

eval_results.txt ADDED Viewed

	@@ -0,0 +1,190 @@

+evaluate 0
+acc = 0.6763925729442971
+acc_and_f1_macro = 0.6304285469163111
+acc_and_f1_weighted = 0.6698067471047697
+class_f1 = [np.float64(nan), np.float64(0.6021505376344086), np.float64(0.7118644067796611), np.float64(0.2522522522522523), np.float64(0.48648648648648646), np.float64(0.5510534846029174), np.float64(0.9125), np.float64(0.8601036269430052), np.float64(0.9136125654450262), np.float64(0.5546218487394958)]
+class_p = [np.float64(nan), np.float64(0.5533596837944664), np.float64(0.7730061349693251), np.float64(0.4745762711864407), np.float64(0.48148148148148145), np.float64(0.48158640226628896), np.float64(0.9125), np.float64(0.8383838383838383), np.float64(0.9306666666666666), np.float64(0.4074074074074074)]
+class_r = [np.float64(0.0), np.float64(0.660377358490566), np.float64(0.6596858638743456), np.float64(0.17177914110429449), np.float64(0.49159663865546216), np.float64(0.6439393939393939), np.float64(0.9125), np.float64(0.8829787234042553), np.float64(0.897172236503856), np.float64(0.868421052631579)]
+confusion_matrix = [[  0   6   0   8   6  21   0   0   0   1]
+ [  0 140  16   0  24  26   0   0   0   6]
+ [  0  43 126   3  11   4   0   0   0   4]
+ [  0  20   5  28  52  55   0   0   0   3]
+ [  0  22   6   8 117  72   0   0   0  13]
+ [  0  18  10  12  33 170   0   0   0  21]
+ [  0   0   0   0   0   0 146   6   8   0]
+ [  0   0   0   0   0   0   4 166  18   0]
+ [  0   2   0   0   0   2  10  26 349   0]
+ [  0   2   0   0   0   3   0   0   0  33]]
+f1_macro = 0.5844645208883252
+f1_weighted = 0.6632209212652425
+evaluate 1
+acc = 0.7082228116710876
+acc_and_f1_macro = 0.6786948288377483
+acc_and_f1_weighted = 0.7058380325692797
+class_f1 = [np.float64(0.17391304347826084), np.float64(0.6373626373626373), np.float64(0.7531172069825437), np.float64(0.44675324675324674), np.float64(0.5204819277108433), np.float64(0.5771543086172345), np.float64(0.8902439024390244), np.float64(0.8723404255319149), np.float64(0.9192708333333333), np.float64(0.7010309278350517)]
+class_p = [np.float64(1.0), np.float64(0.5967078189300411), np.float64(0.719047619047619), np.float64(0.38738738738738737), np.float64(0.6101694915254238), np.float64(0.6127659574468085), np.float64(0.8690476190476191), np.float64(0.8723404255319149), np.float64(0.9313984168865436), np.float64(0.576271186440678)]
+class_r = [np.float64(0.09523809523809523), np.float64(0.6839622641509434), np.float64(0.7905759162303665), np.float64(0.5276073619631901), np.float64(0.453781512605042), np.float64(0.5454545454545454), np.float64(0.9125), np.float64(0.8723404255319149), np.float64(0.9074550128534704), np.float64(0.8947368421052632)]
+confusion_matrix = [[  4   4   2  20   2  10   0   0   0   0]
+ [  0 145  31   4  14  18   0   0   0   0]
+ [  0  32 151   4   0   2   0   0   0   2]
+ [  0  13   4  86  35  21   0   0   0   4]
+ [  0  20  12  50 108  38   0   0   0  10]
+ [  0  27  10  56  18 144   0   0   0   9]
+ [  0   0   0   0   0   0 146   6   8   0]
+ [  0   0   0   0   0   0   6 164  18   0]
+ [  0   0   0   2   0   0  16  18 353   0]
+ [  0   2   0   0   0   2   0   0   0  34]]
+f1_macro = 0.6491668460044091
+f1_weighted = 0.7034532534674718
+evaluate 2
+acc = 0.7230769230769231
+acc_and_f1_macro = 0.6929450152887644
+acc_and_f1_weighted = 0.7202876189409881
+class_f1 = [np.float64(0.07547169811320754), np.float64(0.6326034063260341), np.float64(0.7634408602150539), np.float64(0.466472303206997), np.float64(0.4896073903002309), np.float64(0.6710310965630115), np.float64(0.9090909090909091), np.float64(0.8704663212435233), np.float64(0.9232804232804234), np.float64(0.8266666666666665)]
+class_p = [np.float64(0.18181818181818182), np.float64(0.6532663316582915), np.float64(0.7845303867403315), np.float64(0.4444444444444444), np.float64(0.5435897435897435), np.float64(0.590778097982709), np.float64(0.8823529411764706), np.float64(0.8484848484848485), np.float64(0.9509536784741145), np.float64(0.8378378378378378)]
+class_r = [np.float64(0.047619047619047616), np.float64(0.6132075471698113), np.float64(0.743455497382199), np.float64(0.49079754601226994), np.float64(0.44537815126050423), np.float64(0.7765151515151515), np.float64(0.9375), np.float64(0.8936170212765957), np.float64(0.897172236503856), np.float64(0.8157894736842105)]
+confusion_matrix = [[  2   4   0   8   6  22   0   0   0   0]
+ [  2 130  24   8  22  24   0   0   0   2]
+ [  1  31 142   3   8   6   0   0   0   0]
+ [  4   7   5  80  40  27   0   0   0   0]
+ [  2  16   4  50 106  58   0   0   0   2]
+ [  0  10   6  28  13 205   0   0   0   2]
+ [  0   0   0   0   0   0 150   6   4   0]
+ [  0   0   0   0   0   0   6 168  14   0]
+ [  0   0   0   2   0   0  14  24 349   0]
+ [  0   1   0   1   0   5   0   0   0  31]]
+f1_macro = 0.6628131075006058
+f1_weighted = 0.7174983148050533
+evaluate 3
+acc = 0.6960212201591512
+acc_and_f1_macro = 0.6673784677481204
+acc_and_f1_weighted = 0.6953774805226958
+class_f1 = [np.float64(0.27118644067796605), np.float64(0.6125290023201856), np.float64(0.7792207792207793), np.float64(0.38709677419354843), np.float64(0.5010526315789474), np.float64(0.5797101449275361), np.float64(0.8982035928143712), np.float64(0.8617021276595744), np.float64(0.916010498687664), np.float64(0.5806451612903226)]
+class_p = [np.float64(0.47058823529411764), np.float64(0.6027397260273972), np.float64(0.7731958762886598), np.float64(0.3707865168539326), np.float64(0.5021097046413502), np.float64(0.639269406392694), np.float64(0.8620689655172413), np.float64(0.8617021276595744), np.float64(0.935656836461126), np.float64(0.4186046511627907)]
+class_r = [np.float64(0.19047619047619047), np.float64(0.6226415094339622), np.float64(0.7853403141361257), np.float64(0.4049079754601227), np.float64(0.5), np.float64(0.5303030303030303), np.float64(0.9375), np.float64(0.8617021276595744), np.float64(0.897172236503856), np.float64(0.9473684210526315)]
+confusion_matrix = [[  8   2   2   8  10  12   0   0   0   0]
+ [  2 132  28   8  22  14   0   0   0   6]
+ [  1  23 150   4   7   2   0   0   0   4]
+ [  0  18   6  66  53  10   0   0   0  10]
+ [  0  16   4  45 119  40   0   0   0  14]
+ [  6  27   4  45  26 140   0   0   0  16]
+ [  0   0   0   0   0   0 150   6   4   0]
+ [  0   0   0   0   0   0   6 162  20   0]
+ [  0   0   0   2   0   0  18  20 349   0]
+ [  0   1   0   0   0   1   0   0   0  36]]
+f1_macro = 0.6387357153370895
+f1_weighted = 0.6947337408862403
+evaluate 4
+acc = 0.7220159151193634
+acc_and_f1_macro = 0.6956298157199734
+acc_and_f1_weighted = 0.719944772772531
+class_f1 = [np.float64(0.19047619047619047), np.float64(0.6711711711711712), np.float64(0.7978436657681942), np.float64(0.4473684210526316), np.float64(0.5454545454545454), np.float64(0.6325411334552103), np.float64(0.896969696969697), np.float64(0.839779005524862), np.float64(0.8999999999999999), np.float64(0.7708333333333335)]
+class_p = [np.float64(0.2857142857142857), np.float64(0.6422413793103449), np.float64(0.8222222222222222), np.float64(0.48226950354609927), np.float64(0.548936170212766), np.float64(0.6113074204946997), np.float64(0.8705882352941177), np.float64(0.8735632183908046), np.float64(0.8976982097186701), np.float64(0.6379310344827587)]
+class_r = [np.float64(0.14285714285714285), np.float64(0.7028301886792453), np.float64(0.774869109947644), np.float64(0.4171779141104294), np.float64(0.542016806722689), np.float64(0.6553030303030303), np.float64(0.925), np.float64(0.8085106382978723), np.float64(0.9023136246786633), np.float64(0.9736842105263158)]
+confusion_matrix = [[  6   4   0   4  12  16   0   0   0   0]
+ [  2 149  21   8  14  18   0   0   0   0]
+ [  0  27 148   2   8   6   0   0   0   0]
+ [  3  13   3  68  49  23   0   0   0   4]
+ [  4  20   4  24 129  47   0   0   0  10]
+ [  6  18   4  33  23 173   0   0   0   7]
+ [  0   0   0   0   0   0 148   2  10   0]
+ [  0   0   0   0   0   0   6 152  30   0]
+ [  0   0   0   2   0   0  16  20 351   0]
+ [  0   1   0   0   0   0   0   0   0  37]]
+f1_macro = 0.6692437163205835
+f1_weighted = 0.7178736304256987
+evaluate 5
+acc = 0.7013262599469496
+acc_and_f1_macro = 0.6734780525213865
+acc_and_f1_weighted = 0.7000804134489562
+class_f1 = [np.float64(0.17391304347826086), np.float64(0.6077922077922079), np.float64(0.7937336814621411), np.float64(0.4133333333333334), np.float64(0.5193370165745856), np.float64(0.6147859922178989), np.float64(0.888888888888889), np.float64(0.8314606741573034), np.float64(0.9015151515151514), np.float64(0.7115384615384615)]
+class_p = [np.float64(0.2222222222222222), np.float64(0.6763005780346821), np.float64(0.7916666666666666), np.float64(0.45255474452554745), np.float64(0.46229508196721314), np.float64(0.632), np.float64(0.8780487804878049), np.float64(0.8809523809523809), np.float64(0.8858560794044665), np.float64(0.5606060606060606)]
+class_r = [np.float64(0.14285714285714285), np.float64(0.5518867924528302), np.float64(0.7958115183246073), np.float64(0.3803680981595092), np.float64(0.592436974789916), np.float64(0.5984848484848485), np.float64(0.9), np.float64(0.7872340425531915), np.float64(0.9177377892030848), np.float64(0.9736842105263158)]
+confusion_matrix = [[  6   2   0   4  16  14   0   0   0   0]
+ [  4 117  28   6  29  24   0   0   0   4]
+ [  0  19 152   2  10   4   0   0   0   4]
+ [  5  10   2  62  64  16   0   0   0   4]
+ [  4  14   6  29 141  34   0   0   0  10]
+ [  8  10   4  32  45 158   0   0   0   7]
+ [  0   0   0   0   0   0 144   4  12   0]
+ [  0   0   0   0   0   0   6 148  34   0]
+ [  0   0   0   2   0   0  14  16 357   0]
+ [  0   1   0   0   0   0   0   0   0  37]]
+f1_macro = 0.6456298450958233
+f1_weighted = 0.6988345669509627
+evaluate 6
+acc = 0.7023872679045093
+acc_and_f1_macro = 0.6746700773623057
+acc_and_f1_weighted = 0.7010412183713326
+class_f1 = [np.float64(0.12698412698412698), np.float64(0.653658536585366), np.float64(0.7916666666666666), np.float64(0.39344262295081966), np.float64(0.5190562613430127), np.float64(0.6048387096774194), np.float64(0.888888888888889), np.float64(0.8287292817679558), np.float64(0.8982188295165393), np.float64(0.7640449438202247)]
+class_p = [np.float64(0.19047619047619047), np.float64(0.6767676767676768), np.float64(0.7875647668393783), np.float64(0.4225352112676056), np.float64(0.45686900958466453), np.float64(0.646551724137931), np.float64(0.8780487804878049), np.float64(0.8620689655172413), np.float64(0.889168765743073), np.float64(0.6666666666666666)]
+class_r = [np.float64(0.09523809523809523), np.float64(0.6320754716981132), np.float64(0.7958115183246073), np.float64(0.36809815950920244), np.float64(0.6008403361344538), np.float64(0.5681818181818182), np.float64(0.9), np.float64(0.7978723404255319), np.float64(0.9074550128534704), np.float64(0.8947368421052632)]
+confusion_matrix = [[  4   2   0   6  16  14   0   0   0   0]
+ [  4 134  28   6  26  12   0   0   0   2]
+ [  0  23 152   2  10   4   0   0   0   0]
+ [  3   9   3  60  68  16   0   0   0   4]
+ [  4  16   6  29 143  34   0   0   0   6]
+ [  6  13   4  37  49 150   0   0   0   5]
+ [  0   0   0   0   0   0 144   4  12   0]
+ [  0   0   0   0   0   0   6 150  32   0]
+ [  0   0   0   2   0   0  14  20 353   0]
+ [  0   1   0   0   1   2   0   0   0  34]]
+f1_macro = 0.646952886820102
+f1_weighted = 0.6996951688381559
+evaluate 7
+acc = 0.7045092838196286
+acc_and_f1_macro = 0.6764240590792157
+acc_and_f1_weighted = 0.7031827340830603
+class_f1 = [np.float64(0.12698412698412698), np.float64(0.6504854368932038), np.float64(0.7958115183246073), np.float64(0.39344262295081966), np.float64(0.5209471766848817), np.float64(0.5960000000000001), np.float64(0.8957055214723926), np.float64(0.839779005524862), np.float64(0.9056122448979591), np.float64(0.7586206896551724)]
+class_p = [np.float64(0.19047619047619047), np.float64(0.67), np.float64(0.7958115183246073), np.float64(0.4225352112676056), np.float64(0.45980707395498394), np.float64(0.6313559322033898), np.float64(0.8795180722891566), np.float64(0.8735632183908046), np.float64(0.8987341772151899), np.float64(0.673469387755102)]
+class_r = [np.float64(0.09523809523809523), np.float64(0.6320754716981132), np.float64(0.7958115183246073), np.float64(0.36809815950920244), np.float64(0.6008403361344538), np.float64(0.5643939393939394), np.float64(0.9125), np.float64(0.8085106382978723), np.float64(0.9125964010282777), np.float64(0.868421052631579)]
+confusion_matrix = [[  4   2   0   6  16  14   0   0   0   0]
+ [  4 134  26   6  26  14   0   0   0   2]
+ [  0  23 152   2  10   4   0   0   0   0]
+ [  3   9   3  60  66  18   0   0   0   4]
+ [  4  16   6  29 143  34   0   0   0   6]
+ [  6  15   4  37  49 149   0   0   0   4]
+ [  0   0   0   0   0   0 146   4  10   0]
+ [  0   0   0   0   0   0   6 152  30   0]
+ [  0   0   0   2   0   0  14  18 355   0]
+ [  0   1   0   0   1   3   0   0   0  33]]
+f1_macro = 0.6483388343388026
+f1_weighted = 0.701856184346492
+evaluate 8
+acc = 0.7039787798408488
+acc_and_f1_macro = 0.6787474756977521
+acc_and_f1_weighted = 0.7030329495296339
+class_f1 = [np.float64(0.19047619047619047), np.float64(0.6504854368932038), np.float64(0.7958115183246073), np.float64(0.38562091503267976), np.float64(0.514388489208633), np.float64(0.58130081300813), np.float64(0.8957055214723926), np.float64(0.8510638297872339), np.float64(0.9116883116883118), np.float64(0.7586206896551724)]
+class_p = [np.float64(0.2857142857142857), np.float64(0.67), np.float64(0.7958115183246073), np.float64(0.4125874125874126), np.float64(0.449685534591195), np.float64(0.6271929824561403), np.float64(0.8795180722891566), np.float64(0.851063829787234), np.float64(0.9212598425196851), np.float64(0.673469387755102)]
+class_r = [np.float64(0.14285714285714285), np.float64(0.6320754716981132), np.float64(0.7958115183246073), np.float64(0.3619631901840491), np.float64(0.6008403361344538), np.float64(0.5416666666666666), np.float64(0.9125), np.float64(0.851063829787234), np.float64(0.9023136246786633), np.float64(0.868421052631579)]
+confusion_matrix = [[  6   2   0   6  16  12   0   0   0   0]
+ [  4 134  26   6  26  14   0   0   0   2]
+ [  0  23 152   2  10   4   0   0   0   0]
+ [  3   9   3  59  67  18   0   0   0   4]
+ [  4  16   6  29 143  34   0   0   0   6]
+ [  4  15   4  39  55 143   0   0   0   4]
+ [  0   0   0   0   0   0 146   6   8   0]
+ [  0   0   0   0   0   0   6 160  22   0]
+ [  0   0   0   2   0   0  14  22 351   0]
+ [  0   1   0   0   1   3   0   0   0  33]]
+f1_macro = 0.6535161715546555
+f1_weighted = 0.7020871192184189
+evaluate 9
+acc = 0.7087533156498673
+acc_and_f1_macro = 0.6829852636873044
+acc_and_f1_weighted = 0.707794100689531
+class_f1 = [np.float64(0.19047619047619047), np.float64(0.6504854368932038), np.float64(0.7958115183246073), np.float64(0.38834951456310673), np.float64(0.5174311926605505), np.float64(0.604), np.float64(0.8957055214723926), np.float64(0.858695652173913), np.float64(0.9125964010282778), np.float64(0.7586206896551724)]
+class_p = [np.float64(0.2857142857142857), np.float64(0.67), np.float64(0.7958115183246073), np.float64(0.410958904109589), np.float64(0.4592833876221498), np.float64(0.6398305084745762), np.float64(0.8795180722891566), np.float64(0.8777777777777778), np.float64(0.9125964010282777), np.float64(0.673469387755102)]
+class_r = [np.float64(0.14285714285714285), np.float64(0.6320754716981132), np.float64(0.7958115183246073), np.float64(0.36809815950920244), np.float64(0.592436974789916), np.float64(0.571969696969697), np.float64(0.9125), np.float64(0.8404255319148937), np.float64(0.9125964010282777), np.float64(0.868421052631579)]
+confusion_matrix = [[  6   2   0   6  16  12   0   0   0   0]
+ [  4 134  26   6  26  14   0   0   0   2]
+ [  0  23 152   2  10   4   0   0   0   0]
+ [  3   9   3  60  66  18   0   0   0   4]
+ [  4  16   6  31 141  34   0   0   0   6]
+ [  4  15   4  39  47 151   0   0   0   4]
+ [  0   0   0   0   0   0 146   4  10   0]
+ [  0   0   0   0   0   0   6 158  24   0]
+ [  0   0   0   2   0   0  14  18 355   0]
+ [  0   1   0   0   1   3   0   0   0  33]]
+f1_macro = 0.6572172117247416
+f1_weighted = 0.7068348857291945

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33c1b7efaca3acd78017dbe107de4567a429da6c45e5cf15ad8c53bc42e4ff14
+size 2271116904

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "errors": "replace",
+  "is_local": false,
+  "mask_token": "<mask>",
+  "model_max_length": 8192,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:781c6c66f6f4b7b03b0bbe0096611c39b81c8d040c3d62d11d06307550204c28
+size 2769