jonghhhh commited on
Commit
e27e3a0
·
verified ·
1 Parent(s): 9364ba1

Upload 2 files

Browse files
모델학습평가결과.txt ADDED
@@ -0,0 +1,68 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ethics/텍스트윤리검증데이터/aihub_텍스트윤리검증데이터_중복제거_061424.csv
2
+
3
+ [340225, 42528, 42529]
4
+
5
+ id2label=
6
+ {'IMMORAL_NONE': 0,
7
+ 'CRIME': 1,
8
+ 'SEXUAL': 2,
9
+ 'HATE': 3,
10
+ 'DISCRIMINATION': 4,
11
+ 'CENSURE': 5,
12
+ 'ABUSE': 6,
13
+ 'VIOLENCE': 7}
14
+
15
+ ** 'eval_mean_accuracy': 0.8997096099132357
16
+ Test Results: {'eval_loss': 0.2841951251029968, 'eval_mean_accuracy': 0.8997096099132357, 'eval_f1': 0.644721372735319, 'eval_confusion_matrix': [[[20635, 3291], [4694, 13909]], [[41636, 128], [677, 88]], [[39671, 594], [1215, 1049]], [[34075, 1806], [4632, 2016]], [[37842, 823], [3098, 766]], [[18147, 4960], [5105, 14317]], [[40260, 394], [1274, 601]], [[40177, 471], [960, 921]]], 'eval_accuracy_0': 0.8122457617155353, 'eval_accuracy_1': 0.9810717392837829, 'eval_accuracy_2': 0.9574643184650474, 'eval_accuracy_3': 0.8486209410049613, 'eval_accuracy_4': 0.9078040866232453, 'eval_accuracy_5': 0.763337957628912, 'eval_accuracy_6': 0.960779703261304, 'eval_accuracy_7': 0.9663523713230971, 'eval_runtime': 75.362, 'eval_samples_per_second': 564.33, 'eval_steps_per_second': 35.283, 'epoch': 10.0}
17
+
18
+ Confusion Matrix for Label IMMORAL_NONE:
19
+ [[20635 3291]
20
+ [ 4694 13909]]
21
+ Confusion Matrix for Label CRIME:
22
+ [[41636 128]
23
+ [ 677 88]]
24
+ Confusion Matrix for Label SEXUAL:
25
+ [[39671 594]
26
+ [ 1215 1049]]
27
+ Confusion Matrix for Label HATE:
28
+ [[34075 1806]
29
+ [ 4632 2016]]
30
+ Confusion Matrix for Label DISCRIMINATION:
31
+ [[37842 823]
32
+ [ 3098 766]]
33
+ Confusion Matrix for Label CENSURE:
34
+ [[18147 4960]
35
+ [ 5105 14317]]
36
+ Confusion Matrix for Label ABUSE:
37
+ [[40260 394]
38
+ [ 1274 601]]
39
+ Confusion Matrix for Label VIOLENCE:
40
+ [[40177 471]
41
+ [ 960 921]]
42
+
43
+
44
+ 각 레이블별 정확도와 F1 점수
45
+ IMMORAL_NONE:
46
+ Accuracy: 0.7582
47
+ F1 Score: 0.7771
48
+ CRIME:
49
+ Accuracy: 0.9853
50
+ F1 Score: 0.1807
51
+ SEXUAL:
52
+ Accuracy: 0.9575
53
+ F1 Score: 0.5375
54
+ HATE:
55
+ Accuracy: 0.8760
56
+ F1 Score: 0.3861
57
+ DISCRIMINATION:
58
+ Accuracy: 0.9164
59
+ F1 Score: 0.2805
60
+ CENSURE:
61
+ Accuracy: 0.7706
62
+ F1 Score: 0.7397
63
+ ABUSE:
64
+ Accuracy: 0.9551
65
+ F1 Score: 0.4176
66
+ VIOLENCE:
67
+ Accuracy: 0.9748
68
+ F1 Score: 0.5619
학습데이터 정보.txt ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ## 텍스트 윤리검증 데이터
2
+
3
+ https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=558
4
+
5
+ multiclass:
6
+ ----------/2393(검증)/2659(평가)
7
+ {'eval_loss': 0.3986741900444031, 'eval_accuracy': 0.5832020503656329, 'eval_f1': 0.703118469310467, 'eval_confusion_matrix': [[[21050, 2999], [3218, 15262]], [[41480, 263], [588, 198]], [[39740, 534], [807, 1448]], [[33299, 2411], [4179, 2640]], [[37207, 1481], [2514, 1327]], [[18467, 4441], [4481, 15140]], [[40082, 555], [1012, 880]], [[40144, 501], [754, 1130]]], 'eval_runtime': 76.5959, 'eval_samples_per_second': 555.239, 'eval_steps_per_second': 34.715, 'epoch': 10.0}
8
+
9
+
10
+
11
+
12
+
13
+
14
+
15
+
16
+
17
+
18
+ 구분 통계 정보 항목명 결과
19
+ 1 비윤리성 판단 정보 sentences[].is_immoral 비윤리 문장: 250,307
20
+ 비윤리 아님 문장: 200,803
21
+ 2 비윤리 유형 정보 sentences[].types "CENSURE": 204,029
22
+ "HATE": 69,990
23
+ "DISCRIMINATION": 39,885
24
+ "SEXUAL": 23,682
25
+ "ABUSE": 19,747
26
+ "VIOLENCE": 19,562
27
+ "CRIME": 8,187
28
+ 3 비윤리 강도의 평균 sentences[].intensity 1점: 79,137
29
+ 1점 초과 ~ 2점 미만: 129,230
30
+ 2점: 26,952
31
+ 2점 초과 ~ 3점 미만: 10,140
32
+ 3점: 4,848
33
+ "2점 미만 비율: 83%
34
+ 2점 비율: 11%
35
+ 2점 초과 비율: 6%"
36
+ 4 비윤리 강도투표자 성별 분포 "sentences[].votes[].
37
+ voter[].gender" “female”: 599,811
38
+ “male”: 651,724
39
+ 5 비윤리 강도 투표자 연령 분포 sentences[].votes[].voter[].age "10": 89
40
+ "20": 369,762
41
+ "30": 222,310
42
+ "40": 211,866
43
+ "50": 294,909
44
+ "60": 155,288
45
+ 6 대화세트당 평균 문장수 sentences count ÷ talksets count 3.4
46
+ (451110/132303)
47
+ 7 문장 어절수 분포 “1”: 2,295
48
+ “2”: 14,052
49
+ “3": 40,125
50
+ “4": 64,182
51
+ “5": 74,554
52
+ “6": 70,254
53
+ “7": 57,117
54
+ “8": 42,796
55
+ “9": 30,118
56
+ “10": 19,849
57
+ “11이상": 35,768
58
+ 최빈값: 5 어절 / 중앙값: 5 어절 / 산술평균: 6.4 어절 / 최솟값: 1 어절 / 최댓값: 68 어절