Spaces:

jonghhhh
/

message_ethicality

Runtime error

App Files Files Community

jonghhhh commited on Jul 15, 2024

Commit

e27e3a0

verified ·

1 Parent(s): 9364ba1

Upload 2 files

Browse files

Files changed (2) hide show

모델학습평가결과.txt +68 -0
학습데이터 정보.txt +58 -0

모델학습평가결과.txt ADDED Viewed

	@@ -0,0 +1,68 @@

+ethics/텍스트윤리검증데이터/aihub_텍스트윤리검증데이터_중복제거_061424.csv
+[340225, 42528, 42529]
+id2label=
+{'IMMORAL_NONE': 0,
+ 'CRIME': 1,
+ 'SEXUAL': 2,
+ 'HATE': 3,
+ 'DISCRIMINATION': 4,
+ 'CENSURE': 5,
+ 'ABUSE': 6,
+ 'VIOLENCE': 7}
+** 'eval_mean_accuracy': 0.8997096099132357
+Test Results: {'eval_loss': 0.2841951251029968, 'eval_mean_accuracy': 0.8997096099132357, 'eval_f1': 0.644721372735319, 'eval_confusion_matrix': [[[20635, 3291], [4694, 13909]], [[41636, 128], [677, 88]], [[39671, 594], [1215, 1049]], [[34075, 1806], [4632, 2016]], [[37842, 823], [3098, 766]], [[18147, 4960], [5105, 14317]], [[40260, 394], [1274, 601]], [[40177, 471], [960, 921]]], 'eval_accuracy_0': 0.8122457617155353, 'eval_accuracy_1': 0.9810717392837829, 'eval_accuracy_2': 0.9574643184650474, 'eval_accuracy_3': 0.8486209410049613, 'eval_accuracy_4': 0.9078040866232453, 'eval_accuracy_5': 0.763337957628912, 'eval_accuracy_6': 0.960779703261304, 'eval_accuracy_7': 0.9663523713230971, 'eval_runtime': 75.362, 'eval_samples_per_second': 564.33, 'eval_steps_per_second': 35.283, 'epoch': 10.0}
+Confusion Matrix for Label IMMORAL_NONE:
+[[20635  3291]
+ [ 4694 13909]]
+Confusion Matrix for Label CRIME:
+[[41636   128]
+ [  677    88]]
+Confusion Matrix for Label SEXUAL:
+[[39671   594]
+ [ 1215  1049]]
+Confusion Matrix for Label HATE:
+[[34075  1806]
+ [ 4632  2016]]
+Confusion Matrix for Label DISCRIMINATION:
+[[37842   823]
+ [ 3098   766]]
+Confusion Matrix for Label CENSURE:
+[[18147  4960]
+ [ 5105 14317]]
+Confusion Matrix for Label ABUSE:
+[[40260   394]
+ [ 1274   601]]
+Confusion Matrix for Label VIOLENCE:
+[[40177   471]
+ [  960   921]]
+각 레이블별 정확도와 F1 점수
+IMMORAL_NONE:
+Accuracy: 0.7582
+F1 Score: 0.7771
+CRIME:
+Accuracy: 0.9853
+F1 Score: 0.1807
+SEXUAL:
+Accuracy: 0.9575
+F1 Score: 0.5375
+HATE:
+Accuracy: 0.8760
+F1 Score: 0.3861
+DISCRIMINATION:
+Accuracy: 0.9164
+F1 Score: 0.2805
+CENSURE:
+Accuracy: 0.7706
+F1 Score: 0.7397
+ABUSE:
+Accuracy: 0.9551
+F1 Score: 0.4176
+VIOLENCE:
+Accuracy: 0.9748
+F1 Score: 0.5619

학습데이터 정보.txt ADDED Viewed

	@@ -0,0 +1,58 @@

+## 텍스트 윤리검증 데이터
+https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=558
+multiclass:
+----------/2393(검증)/2659(평가)
+{'eval_loss': 0.3986741900444031, 'eval_accuracy': 0.5832020503656329, 'eval_f1': 0.703118469310467, 'eval_confusion_matrix': [[[21050, 2999], [3218, 15262]], [[41480, 263], [588, 198]], [[39740, 534], [807, 1448]], [[33299, 2411], [4179, 2640]], [[37207, 1481], [2514, 1327]], [[18467, 4441], [4481, 15140]], [[40082, 555], [1012, 880]], [[40144, 501], [754, 1130]]], 'eval_runtime': 76.5959, 'eval_samples_per_second': 555.239, 'eval_steps_per_second': 34.715, 'epoch': 10.0}
+구분	통계 정보	항목명	결과
+1	비윤리성 판단 정보	sentences[].is_immoral	비윤리 문장: 250,307
+비윤리 아님 문장: 200,803
+2	비윤리 유형 정보	sentences[].types	"CENSURE": 204,029
+"HATE": 69,990
+"DISCRIMINATION": 39,885
+"SEXUAL": 23,682
+"ABUSE": 19,747
+"VIOLENCE": 19,562
+"CRIME": 8,187
+3	비윤리 강도의 평균	sentences[].intensity	1점: 79,137
+1점 초과 ~ 2점 미만: 129,230
+2점: 26,952
+2점 초과 ~ 3점 미만: 10,140
+3점: 4,848
+"2점 미만 비율: 83%
+2점 비율: 11%
+2점 초과 비율: 6%"
+4	비윤리 강도투표자 성별 분포	"sentences[].votes[].
+voter[].gender"	“female”: 599,811
+“male”: 651,724
+5	비윤리 강도 투표자 연령 분포	sentences[].votes[].voter[].age	"10": 89
+"20": 369,762
+"30": 222,310
+"40": 211,866
+"50": 294,909
+"60": 155,288
+6	대화세트당 평균 문장수	sentences count ÷ talksets count	3.4
+(451110/132303)
+7	문장 어절수 분포	 	“1”: 2,295
+“2”: 14,052
+“3": 40,125
+“4": 64,182
+“5": 74,554
+“6": 70,254
+“7": 57,117
+“8": 42,796
+“9": 30,118
+“10": 19,849
+“11이상": 35,768
+최빈값: 5 어절 / 중앙값: 5 어절 / 산술평균: 6.4 어절 / 최솟값: 1 어절 / 최댓값: 68 어절