Spaces:

jonghhhh
/

objectivity_predicates

Sleeping

App Files Files Community

jonghhhh commited on Dec 28, 2025

Commit

90804ac

verified ·

1 Parent(s): 7b261cf

Upload 2 files

Browse files

Files changed (2) hide show

src/korean_sentence_splitter.py +601 -0
src/subjectless_predicates_122725_v2.py +448 -0

src/korean_sentence_splitter.py ADDED Viewed

	@@ -0,0 +1,601 @@

+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+Korean Sentence Splitter (한글 문장 분리기)
+==========================================
+정규표현식 기반 한국어 문장 분리 라이브러리.
+KSS(Korean Sentence Splitter) 등 기존 연구를 참고하여 구현.
+주요 특징:
+- 종결어미 기반 문장 분리
+- 구두점(마침표, 느낌표, 물음표 등) 처리
+- 괄호/따옴표 내부 문장 보호
+- 기사 제목 스타일 (명사 종결) 지원
+- 약어 및 숫자 패턴 예외 처리
+References:
+- https://github.com/hyunwoongko/kss
+- https://github.com/likejazz/korean-sentence-splitter
+"""
+import re
+from typing import List, Optional, Tuple
+from dataclasses import dataclass
+from enum import Enum
+class SplitMode(Enum):
+    """문장 분리 모드"""
+    PUNCT_ONLY = "punct"       # 구두점 기반만
+    NORMAL = "normal"          # 일반 모드 (종결어미 + 구두점)
+    AGGRESSIVE = "aggressive"  # 공격적 분리
+@dataclass
+class SplitterConfig:
+    """문장 분리기 설정"""
+    mode: SplitMode = SplitMode.NORMAL
+    strip: bool = True
+    min_length: int = 2
+    preserve_quotes: bool = True
+    preserve_brackets: bool = True
+class KoreanSentenceSplitter:
+    """
+    한국어 문장 분리기
+    Usage:
+        splitter = KoreanSentenceSplitter()
+        sentences = splitter.split("안녕하세요. 반갑습니다!")
+        # ['안녕하세요.', '반갑습니다!']
+    """
+    # ==================== 종결어미 패턴 ====================
+    # 평서형 종결어미 (Declarative)
+    DECLARATIVE_ENDINGS = [
+        # 격식체 (Formal) - 합쇼체
+        '습니다', '입니다', 'ㅂ니다',
+        # 비격식체 (Informal) - 해요체
+        '어요', '아요', '여요', '이에요', '예요', '에요', '세요', '셔요',
+        '죠', '지요',
+        # 해라체 (Plain)
+        '한다', '인다', '는다', '운다', '른다',
+        '었다', '았다', '였다', '겠다',
+        '더라', '더군',
+        # 해체 (Casual)
+        '해', '야', '네', '군', '구나', '구먼',
+        # 기타
+        '거든', '거든요', '답니다', '랍니다',
+        '데요', '래요', '대요',
+    ]
+    # 의문형 종결어미 (Interrogative)
+    INTERROGATIVE_ENDINGS = [
+        '습니까', '입니까', 'ㅂ니까',
+        '나요', '가요',
+        '니', '냐', '나', '까',
+        '은가', '는가', '던가', '을까',
+        '을까요',
+        '지요', '죠', '지', '잖아', '잖아요',
+    ]
+    # 명령형 종결어미 (Imperative)
+    IMPERATIVE_ENDINGS = [
+        '십시오', '세요', '셔요',
+        '아라', '어라', '여라', '거라',
+        '렴', '려무나',
+    ]
+    # 청유형 종결어미 (Propositive)
+    PROPOSITIVE_ENDINGS = [
+        '읍시다', 'ㅂ시다',
+        '자', '자요',
+    ]
+    # 감탄형 종결어미 (Exclamatory)
+    EXCLAMATORY_ENDINGS = [
+        '구나', '군', '네', '로구나', '는군', '구먼',
+        '도다', '로다',
+    ]
+    # 연결어미 (분리하면 안됨) - 더 포괄적인 목록
+    CONNECTIVE_ENDINGS = [
+        '는데', '은데', 'ㄴ데',
+        '지만', '으나', '나',
+        '면서', '으면서', '며', '으며',
+        '고', '고서',
+        '니까', '으니까',
+        '어서', '아서', '여서',
+        '려고', '으려고', '러',
+        '다가', '었다가', '았다가',
+        '도록', '게',
+        '자마자',
+        '거나', '든지', '든가',
+        '려', '으려', '야', '어야', '아야',  # 조건/의도
+    ]
+    # 구두점 패턴
+    PUNCT_PATTERN = r'[.!?。！？]'
+    # 약어 패턴
+    ABBREV_PATTERNS = [
+        r'\d+\.',              # 숫자.
+        r'[A-Za-z]+\.',        # 영문.
+        r'\d+\.\d+',           # 소수점
+        r'\.{2,}',             # 연속 마침표
+    ]
+    # 이모지 패턴
+    EMOJI_PATTERN = re.compile(
+        "["
+        "\U0001F600-\U0001F64F"
+        "\U0001F300-\U0001F5FF"
+        "\U0001F680-\U0001F6FF"
+        "\U0001F1E0-\U0001F1FF"
+        "\U00002702-\U000027B0"
+        "\U000024C2-\U0001F251"
+        "]+",
+        flags=re.UNICODE
+    )
+    # 한글 패턴
+    HANGUL_PATTERN = r'[\uAC00-\uD7A3\u1100-\u11FF\u3130-\u318F]'
+    def __init__(self, config: Optional[SplitterConfig] = None):
+        self.config = config or SplitterConfig()
+        self._compile_patterns()
+    def _compile_patterns(self):
+        """정규표현식 패턴 컴파일"""
+        # 모든 종결어미 결합 (길이순 정렬)
+        all_endings = (
+            self.DECLARATIVE_ENDINGS +
+            self.INTERROGATIVE_ENDINGS +
+            self.IMPERATIVE_ENDINGS +
+            self.PROPOSITIVE_ENDINGS +
+            self.EXCLAMATORY_ENDINGS
+        )
+        all_endings = sorted(set(all_endings), key=len, reverse=True)
+        # 종결어미 패턴
+        endings_str = '|'.join(re.escape(e) for e in all_endings)
+        self.ending_pattern = re.compile(rf'({endings_str})$', re.UNICODE)
+        # 연결어미 패턴
+        conn_str = '|'.join(re.escape(e) for e in self.CONNECTIVE_ENDINGS)
+        self.connective_pattern = re.compile(rf'({conn_str})$', re.UNICODE)
+        # 구두점 패턴
+        self.punct_re = re.compile(self.PUNCT_PATTERN)
+        # 약어 패턴
+        self.abbrev_pattern = re.compile('|'.join(self.ABBREV_PATTERNS))
+    def split(self, text: str) -> List[str]:
+        """텍스트를 문장 단위로 분리"""
+        if not text or not text.strip():
+            return []
+        # 전처리
+        text = re.sub(r'\s+', ' ', text).strip()
+        # 보호 영역 처리
+        text, protected = self._protect_regions(text)
+        # 분리 수행
+        if self.config.mode == SplitMode.PUNCT_ONLY:
+            sentences = self._split_punct_only(text, protected)
+        else:
+            sentences = self._split_with_endings(text, protected)
+        # 보호 영역 복원
+        sentences = self._restore_regions(sentences, protected)
+        # 후처리
+        return self._postprocess(sentences)
+    def _protect_regions(self, text: str) -> Tuple[str, dict]:
+        """괄호/따옴표 내부 보호"""
+        protected = {}
+        counter = 0
+        def replace_fn(match):
+            nonlocal counter
+            token = f"__P{counter}__"
+            protected[token] = match.group(0)
+            counter += 1
+            return token
+        if self.config.preserve_quotes:
+            # 큰따옴표
+            text = re.sub(r'"[^"]*"', replace_fn, text)
+            text = re.sub(r'\u201C[^\u201D]*\u201D', replace_fn, text)  # ""
+            text = re.sub(r'\u300C[^\u300D]*\u300D', replace_fn, text)  # 「」
+            text = re.sub(r'\u300E[^\u300F]*\u300F', replace_fn, text)  # 『』
+            # 작은따옴표
+            text = re.sub(r"'[^']*'", replace_fn, text)
+        if self.config.preserve_brackets:
+            text = re.sub(r'\([^)]*\)', replace_fn, text)
+            text = re.sub(r'\[[^\]]*\]', replace_fn, text)
+        return text, protected
+    def _restore_regions(self, sentences: List[str], protected: dict) -> List[str]:
+        """보호 영역 복원"""
+        result = []
+        for sent in sentences:
+            for token, original in protected.items():
+                sent = sent.replace(token, original)
+            result.append(sent)
+        return result
+    def _split_punct_only(self, text: str, protected: dict = None) -> List[str]:
+        """구두점 기반 분리"""
+        # 약어 보호
+        text, abbrev_map = self._protect_abbrevs(text)
+        # 구두점으로 분리
+        parts = re.split(rf'({self.PUNCT_PATTERN}+\s*)', text)
+        sentences = []
+        current = ""
+        for part in parts:
+            current += part
+            if self.punct_re.search(part):
+                sentences.append(current.strip())
+                current = ""
+            # 보호 구문(토큰) 뒤의 공백에서도 분리 체크
+            elif protected and re.search(r'(__P\d+__)\s*$', current):
+                token_match = re.search(r'(__P\d+__)', current)
+                if token_match:
+                    original = protected.get(token_match.group(1), "")
+                    if self.punct_re.search(original[-2:]):
+                        sentences.append(current.strip())
+                        current = ""
+        if current.strip():
+            sentences.append(current.strip())
+        # 약어 복원
+        return self._restore_abbrevs(sentences, abbrev_map)
+    def _split_with_endings(self, text: str, protected: dict = None) -> List[str]:
+        """종결어미 + 구두점 기반 분리"""
+        # 약어 보호
+        text, abbrev_map = self._protect_abbrevs(text)
+        sentences = []
+        current = ""
+        i = 0
+        while i < len(text):
+            char = text[i]
+            current += char
+            # 구두점 체크
+            if self.punct_re.match(char):
+                # 연속 구두점 모두 포함 (예: ?!, !!, ...)
+                while i + 1 < len(text) and self.punct_re.match(text[i + 1]):
+                    i += 1
+                    current += text[i]
+                # 이모지 포함
+                while i + 1 < len(text) and self.EMOJI_PATTERN.match(text[i + 1]):
+                    i += 1
+                    current += text[i]
+                # 공백까지 포함
+                if i + 1 < len(text) and text[i + 1] in ' \t':
+                    i += 1
+                    current += text[i]
+                # 약어가 아니면 분리
+                if not self._is_abbrev(current.rstrip()):
+                    sentences.append(current)
+                    current = ""
+            # 종결어미 체크 (공백 앞)
+            elif char == ' ' and len(current) > 2:
+                check_text = current.rstrip()
+                if self._is_sentence_ending(check_text, protected):
+                    sentences.append(current)
+                    current = ""
+            i += 1
+        if current.strip():
+            sentences.append(current)
+        # 약어 복원
+        return self._restore_abbrevs(sentences, abbrev_map)
+    def _is_sentence_ending(self, text: str, protected: dict = None) -> bool:
+        """종결어미로 끝나는지 확인 (보호 토큰 처리 포함)"""
+        if not text:
+            return False
+        # 보호 영역(토큰) 체크
+        token_match = re.search(r'(__P\d+__)$', text)
+        if token_match and protected:
+            token = token_match.group(1)
+            original = protected.get(token, "")
+            if not original:
+                return False
+            # 따옴표/괄호 내부 텍스트 추출
+            inner = original.strip()
+            # 1. 구두점으로 끝나는지 확인 (예: "안녕하세요.")
+            if self.punct_re.search(inner[-2:]):
+                return True
+            # 2. 종결어미로 끝나는지 확인 (따옴표 제거 후)
+            stripped_inner = inner.strip('\'"\"“”‘’「」『』()[]')
+            if stripped_inner and self._is_sentence_ending(stripped_inner):
+                return True
+            return False
+        if len(text) < 2:
+            return False
+        # 마지막 단어만 추출 (공백 기준)
+        words = text.split()
+        if not words:
+            return False
+        last_word = words[-1]
+        # 한 글자 단어는 종결어미로 판단하지 않음
+        if len(last_word) == 1:
+            return False
+        # 짧은 종결어미 (1글자) - 명사와 혼동되기 쉬움
+        # 이 경우 더 엄격한 검증 필요
+        SHORT_ENDINGS = ['자', '해', '야', '네', '군', '니', '냐', '나', '까']
+        # 긴 종결어미 (2글자 이상) - 신뢰도 높음
+        LONG_ENDINGS = [e for e in (
+            self.DECLARATIVE_ENDINGS +
+            self.INTERROGATIVE_ENDINGS +
+            self.IMPERATIVE_ENDINGS +
+            self.PROPOSITIVE_ENDINGS +
+            self.EXCLAMATORY_ENDINGS
+        ) if len(e) >= 2]
+        # 연결어미로 끝나면 False
+        for conn in sorted(self.CONNECTIVE_ENDINGS, key=len, reverse=True):
+            if last_word.endswith(conn) and len(last_word) > len(conn):
+                return False
+        # 긴 종결어미 체크 (2글자 이상) - 우선 검사
+        for ending in sorted(LONG_ENDINGS, key=len, reverse=True):
+            if last_word.endswith(ending) and len(last_word) > len(ending):
+                return True
+        # 짧은 종결어미 (1글자) - 앞 글자가 용언 어간일 가능성이 높은지 확인
+        # 한국어 용언 어간은 대체로 모음으로 끝나지 않음 (받침 있음)
+        # 또는 특정 패턴의 어미 활용형
+        for ending in SHORT_ENDINGS:
+            if last_word.endswith(ending) and len(last_word) >= 2:
+                # 어간 추출
+                stem = last_word[:-len(ending)]
+                if len(stem) == 0:
+                    continue
+                # 어간 마지막 글자의 받침 확인
+                last_stem_char = stem[-1]
+                if '\uAC00' <= last_stem_char <= '\uD7A3':  # 완성형 한글
+                    # 받침 여부 확인 (종성이 있는지)
+                    code = ord(last_stem_char) - 0xAC00
+                    jongsung = code % 28
+                    # 동사/형용사 어간으로 보이는 패턴
+                    # 예: 먹 + 자 = 먹자 (받침 있음)
+                    #     가 + 자 = 가자 (받침 없지만 동사)
+                    #     하 + 자 = 하자 (하다 동사)
+                    # "하"로 끝나면 "하다" 동사일 가능성 높음
+                    if stem.endswith('하') or stem.endswith('되'):
+                        return True
+                    # 받침이 있으면 동사 어간일 가능성 높음
+                    if jongsung > 0:
+                        return True
+                    # 받침 없는 경우: "가자", "보자" 등 기본 동사
+                    # 하지만 "피자"와 구분하기 어려움
+                    # 2글자 단어 + 짧은 종결어미는 보수적으로 처리
+                    if len(last_word) <= 2:
+                        return False
+                    # 3글자 이상이면 종결어미일 가능성 있음
+                    return True
+        return False
+    def _protect_abbrevs(self, text: str) -> Tuple[str, dict]:
+        """약어 보호"""
+        abbrev_map = {}
+        counter = 0
+        def replace_fn(match):
+            nonlocal counter
+            token = f"__A{counter}__"
+            abbrev_map[token] = match.group(0)
+            counter += 1
+            return token
+        text = self.abbrev_pattern.sub(replace_fn, text)
+        return text, abbrev_map
+    def _restore_abbrevs(self, sentences: List[str], abbrev_map: dict) -> List[str]:
+        """약어 복원"""
+        result = []
+        for sent in sentences:
+            for token, original in abbrev_map.items():
+                sent = sent.replace(token, original)
+            result.append(sent)
+        return result
+    def _is_abbrev(self, text: str) -> bool:
+        """약어 여부"""
+        if len(text) < 2:
+            return False
+        last_part = text[-10:] if len(text) > 10 else text
+        return bool(self.abbrev_pattern.search(last_part))
+    def _postprocess(self, sentences: List[str]) -> List[str]:
+        """후처리"""
+        result = []
+        for sent in sentences:
+            if self.config.strip:
+                sent = sent.strip()
+            if len(sent) >= self.config.min_length:
+                result.append(sent)
+        return result
+    def split_with_type(self, text: str) -> List[dict]:
+        """문장 분리 + 유형 분석"""
+        sentences = self.split(text)
+        result = []
+        for sent in sentences:
+            sent_type = self._detect_type(sent)
+            result.append({
+                'text': sent,
+                'type': sent_type
+            })
+        return result
+    def _detect_type(self, sent: str) -> str:
+        """문장 유형 판단"""
+        sent = sent.rstrip()
+        if sent.endswith('?') or sent.endswith('\uFF1F'):
+            return 'interrogative'
+        if sent.endswith('!') or sent.endswith('\uFF01'):
+            return 'exclamatory'
+        for e in self.INTERROGATIVE_ENDINGS:
+            if sent.endswith(e):
+                return 'interrogative'
+        for e in self.IMPERATIVE_ENDINGS:
+            if sent.endswith(e):
+                return 'imperative'
+        for e in self.PROPOSITIVE_ENDINGS:
+            if sent.endswith(e):
+                return 'propositive'
+        return 'declarative'
+# ==================== 간편 함수 ====================
+def split_sentences(text: str,
+                    mode: str = "normal",
+                    preserve_quotes: bool = True) -> List[str]:
+    """
+    간편 문장 분리 함수
+    Args:
+        text: 입력 텍스트
+        mode: 'punct' (구두점만) / 'normal' (종결어미+구두점)
+        preserve_quotes: 따옴표 내부 보호
+    Returns:
+        분리된 문장 리스트
+    Example:
+        >>> split_sentences("안녕하세요. 반갑습니다!")
+        ['안녕하세요.', '반갑습니다!']
+    """
+    config = SplitterConfig(
+        mode=SplitMode(mode),
+        preserve_quotes=preserve_quotes
+    )
+    return KoreanSentenceSplitter(config).split(text)
+# ==================== 테스트 ====================
+def run_tests():
+    """테스트 실행"""
+    print("=" * 60)
+    print("한글 문장 분리기 테스트")
+    print("=" * 60)
+    splitter = KoreanSentenceSplitter()
+    test_cases = [
+        # 기본 구두점
+        "안녕하세요. 반갑습니다!",
+        # 종결어미 (구두점 없음)
+        "오늘 날씨가 좋습니다 내일도 맑을 예정입니다",
+        # 의문문
+        "뭐 먹을까요? 저는 피자가 좋아요.",
+        # 따옴표 보호
+        '"안녕하세요. 반갑습니다." 라고 말했다.',
+        # 괄호 보호
+        "서울(대한민국의 수도. 인구 1000만)은 큰 도시입니다.",
+        # 숫자/소수점
+        "3.14는 파이입니다. 원주율이죠.",
+        # 연결어미 vs 종결어미
+        "비가 오는데 우산이 없어요 어떡하죠",
+        # 말줄임표
+        "그래서... 결국 성공했어요!",
+        # 복잡한 문장 (KSS 예제)
+        "회사 동료 분들과 다녀왔는데 분위기도 좋고 음식도 맛있었어요 다만, 강남 토끼정이 강남 쉑쉑버거 골목길로 쭉 올라가야 하는데 다들 쉑쉑버거의 유혹에 넘어갈 뻔 했답니다 강남역 맛집 토끼정의 외부 모습.",
+        # 구어체
+        "ㅋㅋㅋ 너무 웃겨 진짜 최고야",
+        # 명사 종결 (기사 제목)
+        "주가 급등. 투자자들 환호",
+        # 여러 구두점
+        "정말이야?! 믿을 수 없어!!",
+        # 해체
+        "오늘 뭐해 나 심심해 놀자",
+        # ���모지
+        "오늘 너무 행복해요😊 좋은 하루였어요!",
+    ]
+    for i, text in enumerate(test_cases, 1):
+        print(f"\n[테스트 {i}]")
+        print(f"입력: {text}")
+        result = splitter.split(text)
+        print(f"결과: {result}")
+    # 문장 유형 분석 테스트
+    print("\n" + "=" * 60)
+    print("문장 유형 분석 테스트")
+    print("=" * 60)
+    type_test = "오늘 뭐 먹을까요? 저는 피자 먹고 싶어요. 같이 가자! 얼른 준비해."
+    results = splitter.split_with_type(type_test)
+    print(f"\n입력: {type_test}")
+    for r in results:
+        print(f"  [{r['type']:15}] {r['text']}")
+    print("\n" + "=" * 60)
+    print("테스트 완료!")
+    print("=" * 60)
+if __name__ == "__main__":
+    run_tests()

src/subjectless_predicates_122725_v2.py ADDED Viewed

	@@ -0,0 +1,448 @@

+"""
+언론 보도 객관성 측정을 위한 무주체 피동형 술어 정규표현식 (v2)
+================================================================================
+I.  객관성 의심 술어 (DOUBT): 기자 의견으로 여겨질 수 있는 무주체 주관적 술어
+II. 객관성 지지 술어 (SUPPORT): 사실 확인/명시적 출처 기반 술어
+* 무주체 피동형 술어: 발언/판단의 주체가 문장에 없어 기자 의견으로 읽힐 수 있는 표현
+"""
+import re
+from typing import Dict, Pattern, List, Any
+from korean_sentence_splitter import KoreanSentenceSplitter
+# =============================================================================
+# I. 객관성 의심 술어 (DOUBT):
+# =============================================================================
+DOUBT_PREDICATES: Dict[str, Pattern] = {
+    # =========================================================================
+    # 1. 분석/해석형
+    # =========================================================================
+    "분석형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"분석(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"풀이(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"해석(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"진단(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"읽(?:힌다|힙니다|혔다|혔습니다|히고\s*있다|히고\s*있습니다)|"
+        # --- 명사형 술어: 분석/풀이/해석/진단 ---
+        r"(?:분석|풀이|해석|진단)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:분석|풀이|해석|진단)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:분석|풀이|해석|진단)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*나오고\s*있다|도\s*나오고\s*있습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:분석|풀이|해석|진단)(?:이\s*나온다|이\s*나옵니다|이\s*나오고\s*있다|이\s*나오고\s*있습니다|이\s*나왔다|이\s*나왔습니다|이\s*지배적이다|이\s*지배적입니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 2. 전망/예측형
+    # =========================================================================
+    "전망형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"전망(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"예상(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"예측(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"점쳐(?:진다|집니다|졌다|졌습니다|지고\s*있다|지고\s*있습니다)|"
+        r"예견(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:전망|예상|예측)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:전망|예상|예측|관측)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:전망|예상|예측|관측)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*나오고\s*있다|도\s*나오고\s*있습니다|이\s*우세하다|이\s*우세합니다|이\s*지배적이다|이\s*지배적입니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:전망|예상|예측|관측)(?:이\s*나온다|이\s*나옵니다|이\s*나오고\s*있다|이\s*나오고\s*있습니다|이\s*나왔다|이\s*나왔습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 3. 관측/추정형
+    # =========================================================================
+    "관측형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"관측(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"추정(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"추측(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"짐작(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:관측|추정|추측)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:관측|추정|추측)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|���|인)?\s*(?:관측|추정|추측)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|이\s*나온다|이\s*나옵니다|이\s*나오고\s*있다|이\s*나오고\s*있습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 4. 전언/보도형
+    # =========================================================================
+    "전언형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"알려(?:진다|집니다|졌다|졌습니다|지고\s*있다|지고\s*있습니다)|"
+        r"전해(?:진다|집니다|졌다|졌습니다|지고\s*있다|지고\s*있습니다)|"
+        r"보도(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"전달(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        # 것으로 + 전언
+        r"것으로\s*(?:알려졌다|알려졌습니다|알려집니다|알려지고\s*있다|알려지고\s*있습니다|전해졌다|전해졌습니다|전해집니다|전해지고\s*있다|전해지고\s*있습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:소식|보도|소문)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:소식|보도|소문)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는)?\s*(?:소식|보도)(?:이\s*전해졌다|이\s*전해졌습니다|이\s*전해지고\s*있다|이\s*전해지고\s*있습니다|이\s*들려온다|이\s*들려옵니다|이\s*들려왔다|이\s*들려왔습니다)|"
+        # ~라는 겁니다/것입니다
+        r"(?:라는|다는)\s*(?:겁니다|것입니다|것이다|얘기다|얘기입니다|이야기다|이야기입니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 5. 평가/판단형
+    # =========================================================================
+    "평가형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"평가(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다|받고\s*있다|받고\s*있습니다|받았다|받았습니다|받는다|받습니다)|"
+        r"판단(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"인식(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"간주(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"여겨(?:진다|집니다|졌다|졌습니다|지고\s*있다|지고\s*있습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:평가|판단|인식)(?:다|이다|입니다|였다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:평가|판단|인식)(?:다|이다|입니다|였다|이었다|이었습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:평가|판단|인식)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*나오고\s*있다|도\s*나오고\s*있습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:평가|판단)(?:가\s*나온다|가\s*나옵니다|가\s*나오고\s*있다|가\s*나오고\s*있습니다|가\s*나왔다|가\s*나왔습니다|이\s*나온다|이\s*나옵니다)|"
+        r"(?:라는|다는)?\s*(?:평가|판단)(?:를\s*받고\s*있다|를\s*받고\s*있습니다|를\s*받았다|를\s*받았습니다|를\s*받는다|를\s*받습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 6. 비판/지적형
+    # =========================================================================
+    "비판형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"비판(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다|받고\s*있다|받고\s*있습니다|받았다|받았습니다|받는다|받습니다)|"
+        r"비난(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다|받고\s*있다|받고\s*있습니다|받았다|받았습니다|받는다|받습니다)|"
+        r"지적(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다|받고\s*있다|받고\s*있습니다|받았다|받았습니다|받는다|받습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:비판|비난|지적)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:비판|비난|지적)(?:이다|입니다|이었다|이었습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:비판|비난|지적)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*나오고\s*있다|도\s*나오고\s*있습니다|도\s*제기됐다|도\s*제기됐습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:비판|비��|지적)(?:이\s*나온다|이\s*나옵니다|이\s*나오고\s*있다|이\s*나오고\s*있습니다|이\s*나왔다|이\s*나왔습니다|이\s*제기됐다|이\s*제기됐습니다|이\s*제기되고\s*있다|이\s*제기되고\s*있습니다|이\s*쏟아지고\s*있다|이\s*쏟아지고\s*있습니다|이\s*쏟아졌다|이\s*쏟아졌습니다|이\s*잇따르고\s*있다|이\s*잇따르고\s*있습니다|이\s*잇따랐다|이\s*잇따랐습니다)|"
+        r"(?:비판|비난|지적)(?:을\s*받고\s*있다|을\s*받고\s*있습니다|을\s*받았다|을\s*받았습니다|을\s*받는다|을\s*받습니다|을\s*면치\s*못하고\s*있다|을\s*면치\s*못하고\s*있습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 7. 제기/거론형
+    # =========================================================================
+    "제기형": re.compile(
+        r"(?:"
+        r"제기(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"거론(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"언급(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"지목(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"논의(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"검토(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        r"거명(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 8. 우려/의혹형
+    # =========================================================================
+    "우려형": re.compile(
+        r"(?:"
+        # 우려
+        r"우려(?:가|도|를)?\s*(?:있다|있습니다|나온다|나옵니다|나오고\s*있다|나오고\s*있습니다|나왔다|나왔습니다|제기됐다|제기됐습니다|제기되고\s*있다|제기되고\s*있습니다|커지고\s*있다|커지고\s*있습니다|커졌다|커졌습니다|낳고\s*있다|낳고\s*있습니다|낳았다|낳았습니다|높아지고\s*있다|높아지고\s*있습니다)|"
+        # 의혹
+        r"의혹(?:이|을|도)?\s*(?:있다|있습니다|제기됐다|제기됐습니다|제기되고\s*있다|제기되고\s*있습니다|불거졌다|불거졌습니다|불거지고\s*있다|불거지고\s*있습니다|일고\s*있다|일고\s*있습니다|일었다|일었습니다|사고\s*있다|사고\s*있습니다|샀다|샀습니다|증폭되고\s*있다|증폭되고\s*있습니다|확산되고\s*있다|확산되고\s*있습니다)|"
+        # 논란
+        r"논란(?:이|도)?\s*(?:있다|있습니다|일고\s*있다|일고\s*있습니다|일었다|일었습니다|되고\s*있다|되고\s*있습니다|됐다|됐습니다|불거졌다|불거졌습니다|불거지고\s*있다|불거지고\s*있습니다|예상된다|예상됩니다|이어지고\s*있다|이어지고\s*있습니다)|"
+        # 의문
+        r"의문(?:이|도)?\s*(?:있다|있습니다|제기됐다|제기됐습니다|제기되고\s*있다|제기되고\s*있습니다|일고\s*있다|일고\s*있습니다|남는다|남습니다|남아\s*있다|남아\s*있습니다|든다|듭니다)|"
+        # 명사형
+        r"(?:우려|의혹|논란|의문)(?:다|이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:우려|의혹|논란|의문)(?:다|이다|입니다|이었다|이었습니다)|"
+        r"(?:라는|다는)?\s*(?:우려|의혹|논란|의문)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*제기됐다|도\s*제기됐습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 9. 가능성/여지형
+    # =========================================================================
+    "가능성형": re.compile(
+        r"(?:"
+        r"가능성(?:이|도|을)?\s*(?:있다|있습니다|크다|큽니다|높다|높습니다|낮다|낮습니다|제기됐다|제기됐습니다|거론되고\s*있다|거론되고\s*있습니다|점쳐지고\s*있다|점쳐지고\s*있습니다|배제할\s*수\s*없다|배제할\s*수\s*없습니다|열려\s*있다|열려\s*있습니다|열렸다|열렸습니다|제기된다|제기됩니다|나온다|나옵니다)|"
+        r"개연성(?:이|도)?\s*(?:있다|있습니다|크다|큽니다|높다|높습니다|낮다|낮습니다)|"
+        r"여지(?:가|도|를)?\s*(?:있다|있습니다|남아\s*있다|남아\s*있습니다|남겨져\s*있다|남겨져\s*있습니다|남는다|남습니다|남겼다|남겼습니다)|"
+        r"(?:라는|다는)?\s*(?:가능성|개연성|여지)(?:도\s*있다|도\s*있습니다|이\s*제기됐다|이\s*제기됐습니다|이\s*나온다|이\s*나옵니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 10. 분위기/목소리형
+    # =========================================================================
+    "분위기형": re.compile(
+        r"(?:"
+        # 분위기
+        r"분위기(?:다|이다|입니다|이었다|이었습니다|가\s*감지되고\s*있다|가\s*감지되고\s*있습니다|가\s*형성되고\s*있다|가\s*형성되고\s*있습니다|가\s*확산되고\s*있다|가\s*확산되고\s*있습니다|가\s*팽배하다|가\s*팽배합니다|가\s*역력하다|가\s*역력합니다)|"
+        # 목소리
+        r"목소리(?:가|도)?\s*(?:나온다|나옵니다|나오고\s*있다|나오고\s*있습니다|나왔다|나왔습니다|높아지고\s*있다|높아지고\s*있습니다|높아졌다|높아졌습니다|커지고\s*있다|커지고\s*있습니다|커졌다|커졌습니다|있다|있습니다)|"
+        # 기대
+        r"기대(?:가|를|도)?\s*(?:모아지고\s*있다|모아지고\s*있습니다|모이고\s*있다|모이고\s*있습니다|높아지고\s*있다|높아지고\s*있습니다|커지고\s*있다|커지고\s*있습니다|크다|큽니다|높다|높습니다)|"
+        # 관심/이목
+        r"(?:관심|이목)(?:이|을)?\s*(?:쏠리고\s*있다|쏠리고\s*있습니다|쏠렸다|쏠렸습니다|집중되고\s*있다|집중되고\s*있습니다|집중됐다|집중됐습니다|모아지고\s*있다|모아지고\s*있습니다)|"
+        # 기류/조짐/흐름
+        r"(?:기류|조짐|흐름|양상)(?:이|가)?\s*(?:감지되고\s*있다|감지되고\s*있습니다|감지됐다|감지됐습니다|포착되고\s*있다|포착되고\s*있습니다|나타나고\s*있다|나타나고\s*있습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 11. 주장/입장형
+    # =========================================================================
+    "주장형": re.compile(
+        r"(?:"
+        # --- 피동형 술어 ---
+        r"주장(?:된다|됩니다|됐다|됐습니다|되고\s*있다|되고\s*있습니다)|"
+        # --- 명사형 술어 ---
+        r"(?:주장|입장|방침|계획|생각|확신|설명|해명)(?:이다|입니다|이었다|이었습니다|이에요)|"
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:주장|입장|방침|계획|생각|확신|설명|해명)(?:이다|입니다|이었다|이었습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:주장|입장)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|도\s*나오고\s*있다|도\s*나오고\s*있습니다)|"
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:주장|입장|설명|해명)(?:이\s*나온다|이\s*나옵니다|이\s*나오고\s*있다|이\s*나오고\s*있습니다|이\s*나왔다|이\s*나왔습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 12. 시각/견해형
+    # =========================================================================
+    "시각형": re.compile(
+        r"(?:"
+        # 단독 사용
+        r"(?:시각|견해|관점|자평)(?:이다|다|입니다|이었다|였다|이었습니다|이에요)|"
+        # ~라는 + 명사
+        r"(?:라는|다는|이라는|란|는|은|인)\s*(?:시각|견해|관점|인식|자평)(?:이다|다|입니다|이었다|였다|이었습니다)|"
+        # 명사 + 도 있다/지배적이다
+        r"(?:라는|다는|이라는|란|는|은|인)?\s*(?:시각|견해|관점|인식)(?:도\s*있다|도\s*있습니다|도\s*나온다|도\s*나옵니다|이\s*있다|이\s*있습니다|이\s*나온다|이\s*나옵니다|이\s*지배적이다|이\s*지배적입니다|가\s*지배적이다|가\s*지배적입니다|이\s*우세하다|이\s*우세합니다|가\s*우세하다|가\s*우세합니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 13. 격찬/혹평형 (극단적 평가)
+    # =========================================================================
+    "격찬형": re.compile(
+        r"(?:"
+        r"(?:격찬|찬사|호평)(?:이|을)?\s*(?:쏟아졌다|쏟아졌습니다|쏟아지고\s*있다|쏟아지고\s*있습니다|이어졌다|이어졌습니다|이어지고\s*있다|이어지고\s*있습니다|나왔다|나왔습니다|나오고\s*있다|나오고\s*있습니다|받았다|받았습니다|받고\s*있다|받고\s*있습니다)|"
+        r"(?:혹평|악평)(?:이|을)?\s*(?:쏟아졌다|쏟아졌습니다|쏟아지고\s*있다|쏟아지고\s*있습니다|이어졌다|이어졌습니다|이어지고\s*있다|이어지고\s*있습니다|나왔다|나왔습니다|나오고\s*있다|나오고\s*있습니다|받았다|받았습니다|받고\s*있다|받고\s*있습니다)|"
+        r"(?:라는|다는)?\s*(?:격찬|찬사|호평|혹평|악평)(?:이다|입니다|이었다|이었습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 15. 관용표현형
+    # =========================================================================
+    "관용표현형": re.compile(
+        r"(?:"
+        # ~한 셈이다
+        r"[은는인된한했던]\s*셈(?:이다|입니다|이에요|이었다|이었습니다)|"
+        r"셈(?:이다|입니다|이에요|이었다|이었습니다)|"
+        # ~해야 할 판이다
+        r"(?:해야\s*할|하게\s*된|하게\s*됐)\s*판(?:이다|입니다|이에요)|"
+        # ~로 보인다/여겨진다/비춰진다
+        r"(?:으로|로)\s*(?:보인다|보입니다|보여진다|보여집니다|보이고\s*있다|보이고\s*있습니다)|"
+        r"(?:으로|로)\s*(?:여겨진다|여겨집집니다|여겨지고\s*있다|여겨지고\s*있습니다)|"
+        r"(?:으로|로)\s*(?:비춰진다|비춰집니다|비쳐진다|비쳐집니다|비쳐지고\s*있다|비쳐지고\s*있습니다)|"
+        r"(?:으로|로)\s*(?:받아들여지고\s*있다|받아들여지고\s*있습니다|받아들여진다|받아들여집니다|받아들여졌다|받아들여졌습니다)|"
+        # ~것 아니냐는/~지 않겠느냐는
+        r"(?:는|은)\s*것\s*아니(?:냐는|냐고|겠냐는|냐며)|"
+        r"(?:지|치)\s*않(?:겠느냐는|을까\s*하는|을까\s*싶은|느냐는)|"
+        # ~가 아닌가 싶다
+        r"(?:가|이)\s*아닌가\s*(?:싶다|싶습니다|하는|하다|합니다)|"
+        # ~를 짐작하게/케 한다
+        r"(?:을|를)?\s*짐작(?:하게|케)\s*(?:한다|합니다|했다|했습니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 16. 완화표현형 (Hedges)
+    # =========================================================================
+    "완화표현형": re.compile(
+        r"(?:"
+        # 것으로 + 술어
+        r"것으로\s*(?:보인다|보입니다|보여진다|보여집니다)|"
+        r"것으로\s*(?:추정된다|추정됩니다|추정되고\s*있다|추정되고\s*있습니다)|"
+        r"것으로\s*(?:판단된다|판단됩니다|판단되고\s*있다|판단되고\s*있습니다)|"
+        r"것으로\s*(?:분석된다|분석됩니다|분석되고\s*있다|분석되고\s*있습니다)|"
+        r"것으로\s*(?:예상된다|예상됩니다|예상되고\s*있다|예상되고\s*있습니다)|"
+        r"것으로\s*(?:전망된다|전망됩니다|전망되고\s*있다|전망되고\s*있습니다)|"
+        r"것으로\s*(?:관측된다|관측됩니다|관측되고\s*있다|관측되고\s*있습니다)|"
+        r"것으로\s*(?:평가된다|평가됩니다|평가되고\s*있다|평가되고\s*있습니다)|"
+        r"것으로\s*(?:풀이된다|풀이됩니다|풀이되고\s*있다|풀이되고\s*있습니다)|"
+        r"것으로\s*(?:해석된다|해석됩니다|해석되고\s*있다|해석되고\s*있습니다)|"
+        r"것으로\s*(?:파악된다|파악됩니다|파악되고\s*있다|파악되고\s*있습니다)|"
+        r"것으로\s*(?:나타났다|나타났습니다|나타나고\s*있다|나타나고\s*있습니다)|"
+        # 듯 + 술어
+        r"듯\s*(?:보인다|보입니다|하다|합니다|싶다|싶습니다)|"
+        # ~지도 모른다
+        r"[을를]지도?\s*모른(?:다|릅니다)|"
+        # ~ㄹ 것 같다
+        r"[을를]\s*것\s*같(?:다|습니다)"
+        r")"
+    ),
+}
+# =============================================================================
+# II. 객관성 지지 술어 (SUPPORT):
+# =============================================================================
+SUPPORT_PREDICATES: Dict[str, Pattern] = {
+    # =========================================================================
+    # 1. 확인/검증형
+    # =========================================================================
+    "확인형": re.compile(
+        r"(?:"
+        # 확인/밝혀지다/드러나다
+        r"확인(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"밝혀(?:졌다|졌습니다|진다|집니다|지고\s*있다|지고\s*있습니다)|"
+        r"드러(?:났다|났습니다|난다|납니다|나고\s*있다|나고\s*있습니다)|"
+        r"판명(?:됐다|됐습니다|된다|됩니다|났다|났습니다)|"
+        r"입증(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다)|"
+        r"규명(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다)|"
+        r")"
+    ),
+    # =========================================================================
+    # 2. 발견/탐지형
+    # =========================================================================
+    "발견형": re.compile(
+        r"(?:"
+        r"발견(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"발각(?:됐다|됐습니다|된다|됩니다)|"
+        r"적발(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다)|"
+        r"포착(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다)|"
+        r"감지(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다)|"
+        r"파악(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)"
+        r")"
+    ),
+    # =========================================================================
+    # 3. 기록/집계형
+    # =========================================================================
+    "기록형": re.compile(
+        r"(?:"
+        r"기록(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"집계(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"조사(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"측정(?:됐다|됐습니다|된다|됩니다|되고\s*있다|되고\s*있습니다|했다|했습니다|한다|합니다)|"
+        r"나타(?:났다|났습니다|난다|납니다)"
+        r")"
+    ),
+}
+# =============================================================================
+# 유틸리티 함수
+# =============================================================================
+def analyze_objectivity(text: str) -> Dict[str, Any]:
+    """텍스트를 문장 단위로 나누어 객관성 의심/지지 요소를 분석"""
+    splitter = KoreanSentenceSplitter()
+    sentences = splitter.split(text)
+    doubt_predicates = []
+    support_predicates = []
+    doubt_sentences = []
+    support_sentences = []
+    doubt_sentence_count = 0
+    support_sentence_count = 0
+    for sent in sentences:
+        sent_doubt_matches = []
+        sent_support_matches = []
+        # 중복 방지를 위한 스팬(Span) 기반 체크
+        doubt_spans = {}
+        support_spans = {}
+        for _, pattern in DOUBT_PREDICATES.items():
+            for match in pattern.finditer(sent):
+                m_text = match.group(0).strip()
+                if m_text:
+                    doubt_spans[match.span()] = m_text
+        for _, pattern in SUPPORT_PREDICATES.items():
+            for match in pattern.finditer(sent):
+                m_text = match.group(0).strip()
+                if m_text:
+                    support_spans[match.span()] = m_text
+        # 문장 내 추출 결과 정리
+        if doubt_spans:
+            sorted_doubt = [doubt_spans[s] for s in sorted(doubt_spans.keys())]
+            doubt_predicates.extend(sorted_doubt)
+            doubt_sentences.append(sent)
+            doubt_sentence_count += 1
+        if support_spans:
+            sorted_support = [support_spans[s] for s in sorted(support_spans.keys())]
+            support_predicates.extend(sorted_support)
+            support_sentences.append(sent)
+            support_sentence_count += 1
+    total_sentences = doubt_sentence_count + support_sentence_count
+    return {
+        "doubt_predicates": doubt_predicates,
+        "support_predicates": support_predicates,
+        "doubt_sentences": doubt_sentences,
+        "support_sentences": support_sentences,
+        "doubt_count": doubt_sentence_count,
+        "support_count": support_sentence_count,
+        "objectivity_ratio": round(support_sentence_count / total_sentences, 4) if total_sentences > 0 else None
+    }
+def find_doubt_predicates(text: str) -> Dict[str, List[str]]:
+    """객관성 의심 술어만 반환"""
+    results = {}
+    for category, pattern in DOUBT_PREDICATES.items():
+        matches = pattern.findall(text)
+        if matches:
+            results[category] = matches
+    return results
+def find_support_predicates(text: str) -> Dict[str, List[str]]:
+    """객관성 지지 술어만 반환"""
+    results = {}
+    for category, pattern in SUPPORT_PREDICATES.items():
+        matches = pattern.findall(text)
+        if matches:
+            results[category] = matches
+    return results
+def print_pattern_summary():
+    """패턴 요약 출력"""
+    print("=" * 70)
+    print("언론 보도 객관성 측정용 무주체 술어 정규표현식 v2")
+    print("=" * 70)
+    print()
+    print("I. 객관성 의심 술어 (DOUBT) - 무주체 주관적 술어")
+    print("-" * 70)
+    for i, (name, _) in enumerate(DOUBT_PREDICATES.items(), 1):
+        print(f"   {i:2d}. {name}")
+    print(f"\n   총 {len(DOUBT_PREDICATES)}개 카테고리")
+    print()
+    print("II. 객관성 지지 술어 (SUPPORT) - 사실 확인/명시적 출처")
+    print("-" * 70)
+    for i, (name, _) in enumerate(SUPPORT_PREDICATES.items(), 1):
+        print(f"   {i:2d}. {name}")
+    print(f"\n   총 {len(SUPPORT_PREDICATES)}개 카테고리")
+    print("=" * 70)
+if __name__ == "__main__":
+    print_pattern_summary()