jonghhhh commited on
Commit
0edd3fe
·
verified ·
1 Parent(s): 89fe07d

Upload 2 files

Browse files
Files changed (2) hide show
  1. README.md +58 -0
  2. requirements.txt +2 -0
README.md ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: 뉴스 객관성 술어 분석기
3
+ emoji: 📰
4
+ colorFrom: blue
5
+ colorTo: green
6
+ sdk: streamlit
7
+ sdk_version: 1.31.0
8
+ app_file: app.py
9
+ pinned: false
10
+ ---
11
+
12
+ # 뉴스 객관성 분석기: 술어 성격 탐지 및 추출
13
+
14
+ 뉴스 기사의 객관성을 평가하기 위해 술어의 성격을 자동으로 탐지하고 추출하는 Streamlit 웹 애플리케이션입니다.
15
+
16
+ ## 기능
17
+
18
+ 이 애플리케이션은 한국어 뉴스 기사를 분석하여 다음 두 가지 유형의 술어를 탐지합니다:
19
+
20
+ ### 🔴 객관성 의심 술어 (Objectivity Doubt)
21
+ 발언의 주체가 불분명하여 기자의 주관이 개입되었을 가능성이 높은 표현을 탐지합니다.
22
+ - 분석/해석형 (예: 분석된다, 해석된다)
23
+ - 전망/예측형 (예: 전망된다, 예상된다)
24
+ - 관측/추정형 (예: 추정된다, 추측된다)
25
+ - 전언/보도형 (예: 알려졌다, 전해졌다)
26
+ - 평가/판단형 (예: 평가된다, 여겨진다)
27
+ - 비판/지적형 (예: 비판받는다, 지적된다)
28
+ - 기타 14개 카테고리
29
+
30
+ ### 🟢 객관성 지지 술어 (Objectivity Support)
31
+ 사실 확인이나 구체적인 출처/데이터를 바탕으로 한 객관적 표현을 탐지합니다.
32
+ - 확인/검증형 (예: 확인됐다, 밝혀졌다)
33
+ - 발견/탐지형 (예: 발견됐다, 적발됐다)
34
+ - 기록/집계형 (예: 기록됐다, 집계됐다)
35
+
36
+ ## 사용 방법
37
+
38
+ 1. 분석할 뉴스 기사 내용을 텍스트 영역에 입력합니다
39
+ 2. "분석" 버튼을 클릭합니다
40
+ 3. 결과 화면에서 다음을 확인할 수 있습니다:
41
+ - 색상으로 강조된 텍스트 (빨간색: 의심 술어, 녹색: 지지 술어)
42
+ - 의심 문장 수와 지지 문장 수
43
+ - 객관성 지표 (지지 문장 비율)
44
+ - 검출된 술어 상세 목록
45
+
46
+ ## 기술 스택
47
+
48
+ - **Streamlit**: 웹 애플리케이션 프레임워크
49
+ - **정규표현식**: 술어 패턴 매칭
50
+ - **Korean Sentence Splitter**: 한국어 문장 분리
51
+
52
+ ## 연구 배경
53
+
54
+ 이 도구는 언론 보도의 객관성을 측정하기 위한 연구의 일환으로 개발되었습니다. 무주체 피동형 술어(발언/판단의 주체가 문장에 없어 기자 의견으로 읽힐 수 있는 표현)를 자동으로 탐지하여 뉴스 기사의 객관성을 정량적으로 평가합니다.
55
+
56
+ ## 라이선스
57
+
58
+ 이 프로젝트는 연구 목적으로 개발되었습니다.
requirements.txt ADDED
@@ -0,0 +1,2 @@
 
 
 
1
+ streamlit==1.31.0
2
+ korean-sentence-splitter==0.1.0