coconut / IR_DECK.md
alohaboy
feat: Add LLM-based chat mode and integrate YJ pipeline
caf53ab
# COCONUT AI
## 반향어 치료 보조 어시스턴트 IR 자료
---
## 📋 목차
1. [문제 정의](#문제-정의)
2. [솔루션](#솔루션)
3. [핵심 기능](#핵심-기능)
4. [기술 스택](#기술-스택)
5. [차별화 포인트](#차별화-포인트)
6. [성장 전략](#성장-전략)
7. [임상 협력 계획](#임상-협력-계획)
8. [보안 및 안전장치](#보안-및-안전장치)
9. [재무 계획](#재무-계획)
---
## 🎯 문제 정의
### 사회 문제
자폐 스펙트럼 장애 아동의 약 75% 이상이 **반향어(에콜랄리아)** 형태의 발화를 사용하며, 이는 단순한 언어 지연이 아니라 **의도 전달의 실패**로 이어집니다.
### 핵심 페인 포인트
- **보호자**: 아이의 말을 이해하지 못해 지속적인 오해와 불안 경험
- **아동**: 의사표현 어려움으로 인한 소통 좌절
- **치료사**: 즉시 대응 가능한 치료 도구 부재
- **가족**: 상호작용 단절로 인한 돌봄 스트레스 악화
### 기존 솔루션의 한계
- 대면 치료 세션 중심 → 즉시성 부족
- 전문가 의존 → 접근성 제한
- 데이터 부족 → 개인 맞춤화 어려움
---
## 💡 솔루션
**Coconut AI**는 AI 기반 반향어 감지 및 기능적 의사소통 전환 도구로, 아동의 반복된 발화를 실시간으로 분석하여 **의미 있는 대화로 변환**합니다.
### 핵심 가치
1. **실시간 해석**: 즉각적인 의사소통 이해
2. **3단계 전환**: L1 → L2 → L3 점진적 발전
3. **개인화된 분석**: CARS 검사 기반 맞춤 치료
4. **무료 웹 접근**: 보호자 친화적 UX
---
## ⚡ 핵심 기능
### 1️⃣ 텍스트 분석 (빠른/상세 모드)
- **반향어 자동 감지**: AI + 룰베이스 하이브리드
- **신뢰도 색상 코딩**: 즉시 이해 가능한 시각적 피드백
- **맥락 분석**: 상황별 정확한 판단
- **불확실성 표시**: 신뢰도 < 70% 시 검증 권장
### 2️⃣ 음성 분석
- **음성 인식**: Whisper 기반 자동 전사
- **실시간 분석**: 반향어 감지 및 변환
- **음성 합성**: TTS로 변환된 발화 재생
- **다양한 형식**: WAV, MP3, M4A 지원
### 3️⃣ 사용자 프로필
- **아동 정보 관리**: 나이, 언어 수준, 언어습관
- **CARS 검사**: 15문항 완전판 표준화 평가
- **개인화 분석**: 프로필 기반 맞춤형 치료
- **발달 추적**: 장기적 발전 모니터링
### 4️⃣ 대본 기반 녹음
- **카테고리별 대본**: 일상 루틴, 놀이 활동, 감정 표현 등
- **체계적 연습**: 가이드된 대화 상황
- **피드백 제공**: 즉시 분석 결과 확인
### 5️⃣ 3단계 변환 시스템
| 단계 | 특징 | 예시 |
|------|------|------|
| **L1** | 기본 수준 | "물 주세요" |
| **L2** | 확장 수준 | "차가운 물 주세요" |
| **L3** | 자기표현 수준 | "지금 목이 말라서 차가운 물이 필요해요" |
---
## 🔧 기술 스택
### 백엔드
- **Python 3.10+**
- **Gradio 4.44.0** (웹 인터페이스)
- **SQLite3** (데이터 저장)
### AI/ML
- **OpenAI GPT-4o-mini** (자연어 이해/생성)
- **OpenAI Whisper** (음성 인식)
- **OpenAI TTS** (음성 합성)
### 아키텍처
- **하이브리드 감지**: AI + 룰베이스 폴백
- **다차원 분석**: 5개 지표 기반 신뢰도 계산
- **실시간 처리**: < 3초 응답 시간
---
## 🎨 차별화 포인트
### vs 기존 AAC 도구
| 구분 | 기존 도구 | Coconut AI |
|------|----------|-----------|
| **접근성** | 높은 비용 | 무료 웹 접근 |
| **즉시성** | 제한적 | 실시간 대응 |
| **데이터 추적** | 없음 | 장기 발달 추적 |
| **AI 활용** | 제한적 | 고도화된 AI |
### vs 기존 언어치료
| 구분 | 대면 치료 | Coconut AI |
|------|----------|-----------|
| **접근성** | 병원 방문 | 가정에서 사용 |
| **빈도** | 주 1-2회 | 24/7 가용 |
| **비용** | 높음 | 무료 |
| **데이터 기반** | 제한적 | 체계적 추적 |
### 기술적 차별화
1. **맥락 기반 분석**: 상황 정보 통합
2. **불확실성 표시**: 신뢰도별 색상 코딩
3. **단계별 전환**: L1/L2/L3 명확 구분
4. **보안 강화**: 토큰 제어, 입력 검증, 프롬프트 주입 방지
---
## 📈 성장 전략
### Phase 1 (완료) ✅
- ✅ 사용성 개선: 빠른/상세 분석 모드
- ✅ 불확실성 표시: 신뢰도 색상 코딩
- ✅ 결과 표현 단순화: 핵심 메시지 강조
### Phase 2 (진행 예정) 🔄
- 🔲 인간 검증 루프: 보호자 수정/피드백
- 🔲 긴급 상황 감지: 신뢰도 < 60% 경고
- 🔲 위험 케이스 가이드라인: 전문가 상담 권장
### Phase 3 (계획 중) 📋
- 🔲 세브란스/MoU 준비
- 🔲 IRB 절차 문서화
- 🔲 용어 정리 및 검증 사례 문서
- 🔲 치료사 교육 자료
### Phase 4 (장기) 🚀
- 🔲 PWA 버전
- 🔲 음성 녹음 UI 개선
- 🔲 앱 스토어 배포 준비
- 🔲 오프라인 지원
### 확장 가능성
- **다국어 지원**: 글로벌 확장
- **다양한 장애**: 언어 발달 지연, 치매 등
- **B2B 모델**: 병원, 학교, 치료 센터
- **B2C 모델**: 개인 보호자 구독
---
## 🏥 임상 협력 계획
### 현재 상태
- **기반 기능 완성**: 텍스트/음성 분석, 프로필 관리
- **보안 강화**: 토큰 제어, 입력 검증 완료
- **Phase 1 완료**: 사용성 개선 완료
### 다음 단계
1. **세브란스 협력**: MoU 체결, IRB 신청
2. **임상 검증**: 50-100명 표본 테스트
3. **논문 발간**: 효과성 검증 연구
4. **용어 정리**: 의료진 교육 자료 제작
### 검증 전략
- **정량적 지표**: 반향어 감지 정확도, 보호자 만족도
- **정성적 평가**: 치료사 피드백, 임상 전문가 검토
- **장기 추적**: 6개월-1년 발달 데이터 수집
---
## 🔒 보안 및 안전장치
### API 보안
- **토큰 제어**: 일일 500회, 200K 토큰 제한
- **세션 제한**: 세션당 100회 호출 제한
- **Rate Limiting**: 무분별한 사용 방지
### 입력 검증
- **길이 제한**: 최대 1000자
- **프롬프트 주입 방지**: 악의적 입력 탐지
- **특수 문자 필터**: 과도한 특수문자 차단
### 데이터 보호
- **로그 익명화**: 개인정보 보호
- **데이터 폐기**: 일정 기간 후 삭제
- **HIPAA 준수**: 의료 데이터 보호
### 안전 가이드라인
- **불확실성 표시**: 신뢰도 < 70% 경고
- **전문가 상담 권장**: 심각한 케이스 알림
- **보조 도구 명시**: 의료 행위 아님 명확화
---
## 💰 재무 계획
### 비용 구조
- **OpenAI API**: ~$10/일 (200K 토큰 기준)
- **인프라**: Hugging Face Space (무료 - CPU Basic)
- **개발**: 자체 개발 (비용 최소화)
### 수익 모델 (향후)
1. **B2B SaaS**: 병원/학교 구독 (~$500/월)
2. **B2C 프리미엄**: 개인 보호자 구독 (~$20/월)
3. **라이선스**: 의료 기관 판매
4. **정부 지원**: 보건복지부 정책 연계
### 예상 비용 (연간)
- **API**: $3,600/년
- **인프라**: $0 (무료 플랜)
- **총 비용**: ~$4,000/년
---
## 📊 주요 지표 (예상)
### 현재 (MVP)
- **정확도**: 70-80% (보수적 추정)
- **응답 시간**: < 3초
- **일일 사용**: ~500회 (제한)
### 목표 (1년)
- **정확도**: 90%+ (임상 검증 후)
- **사용자**: 1,000명+
- **데이터**: 10,000건+ 수집
- **임상 협력**: 세브란스 MoU 완료
---
## 🎯 ROI (투자 효과)
### 사회적 임팩트
- **보호자 스트레스 감소**: 정량 측정 가능
- **아동 의사소통 향상**: 발달 지표 개선
- **치료 효율성 증가**: 대면 세션 + AI 보완
### 비즈니스 가치
- **시장 규모**: 국내 자폐 아동 ~10,000명
- **글로벌 확장**: 1억+ 잠재 사용자
- **기술 이전**: 유사 장애 그룹 확장 가능
---
## 🚀 즉시 가능한 것들
### 이미 완성된 기능 ✅
1. 텍스트/음성 분석 시스템
2. 3단계 변환 파이프라인
3. 사용자 프로필 관리
4. CARS 검사 통합
5. 대본 기반 녹음
6. 보안 및 토큰 제어
7. 신뢰도 시각화
### 곧 가능한 것들 🔄
1. 세브란스 협력 시작
2. 임상 데이터 수집
3. 정확도 개선 (RLHF)
4. 모바일 앱 출시
---
## 📞 다음 단계
### 투자자/파트너에게
1. **IRB 신청 지원**: 임상 검증 빠른 진행
2. **데이터 수집 협력**: 임상 현장 접근
3. **마케팅 지원**: 보호자 커뮤니티 홍보
4. **전문가 연결**: 언어치료 전문가 자문
### 세브란스/MoU 협력
- **임상 데이터**: 실제 환자 테스트
- **전문가 검증**: 치료사 피드백
- **논문 공동연구**: 효과성 검증
- **라인업 구축**: 병원 내 배포
---
## 📝 요약
**Coconut AI**는 자폐 아동의 반향어를 실시간으로 분석하여 기능적 의사소통으로 전환하는 혁신적 AI 도구입니다.
### 왜 지금인가?
- ✅ 기술적 기반 완성
- ✅ 보안 강화 완료
- ✅ 사용성 개선 완료
- 🔄 임상 검증 준비 완료
### 왜 Coconut AI인가?
- 🎯 명확한 문제 정의
- 💡 독특한 3단계 변환
- 🔧 검증된 기술 스택
- 🚀 확장 가능한 비즈니스 모델
---
**Contact**: [연락처 정보]
**Demo**: http://localhost:7860
**Repository**: [GitHub 링크]
---
*이 자료는 Coconut AI 프로젝트 IR을 위한 요약 문서입니다.*