Spaces:

alohaboy
/

coconut

Running

App Files Files Community

coconut / IR_DECK.md

alohaboy

feat: Add LLM-based chat mode and integrate YJ pipeline

caf53ab 3 months ago

preview code

raw

history blame contribute delete

9.47 kB

	# COCONUT AI
	## 반향어 치료 보조 어시스턴트 IR 자료

	---

	## 📋 목차
	1. [문제 정의](#문제-정의)
	2. [솔루션](#솔루션)
	3. [핵심 기능](#핵심-기능)
	4. [기술 스택](#기술-스택)
	5. [차별화 포인트](#차별화-포인트)
	6. [성장 전략](#성장-전략)
	7. [임상 협력 계획](#임상-협력-계획)
	8. [보안 및 안전장치](#보안-및-안전장치)
	9. [재무 계획](#재무-계획)

	---

	## 🎯 문제 정의

	### 사회 문제
	자폐 스펙트럼 장애 아동의 약 75% 이상이 반향어(에콜랄리아) 형태의 발화를 사용하며, 이는 단순한 언어 지연이 아니라 의도 전달의 실패로 이어집니다.

	### 핵심 페인 포인트
	- 보호자: 아이의 말을 이해하지 못해 지속적인 오해와 불안 경험
	- 아동: 의사표현 어려움으로 인한 소통 좌절
	- 치료사: 즉시 대응 가능한 치료 도구 부재
	- 가족: 상호작용 단절로 인한 돌봄 스트레스 악화

	### 기존 솔루션의 한계
	- 대면 치료 세션 중심 → 즉시성 부족
	- 전문가 의존 → 접근성 제한
	- 데이터 부족 → 개인 맞춤화 어려움

	---

	## 💡 솔루션

	Coconut AI는 AI 기반 반향어 감지 및 기능적 의사소통 전환 도구로, 아동의 반복된 발화를 실시간으로 분석하여 의미 있는 대화로 변환합니다.

	### 핵심 가치
	1. 실시간 해석: 즉각적인 의사소통 이해
	2. 3단계 전환: L1 → L2 → L3 점진적 발전
	3. 개인화된 분석: CARS 검사 기반 맞춤 치료
	4. 무료 웹 접근: 보호자 친화적 UX

	---

	## ⚡ 핵심 기능

	### 1️⃣ 텍스트 분석 (빠른/상세 모드)
	- 반향어 자동 감지: AI + 룰베이스 하이브리드
	- 신뢰도 색상 코딩: 즉시 이해 가능한 시각적 피드백
	- 맥락 분석: 상황별 정확한 판단
	- 불확실성 표시: 신뢰도 < 70% 시 검증 권장

	### 2️⃣ 음성 분석
	- 음성 인식: Whisper 기반 자동 전사
	- 실시간 분석: 반향어 감지 및 변환
	- 음성 합성: TTS로 변환된 발화 재생
	- 다양한 형식: WAV, MP3, M4A 지원

	### 3️⃣ 사용자 프로필
	- 아동 정보 관리: 나이, 언어 수준, 언어습관
	- CARS 검사: 15문항 완전판 표준화 평가
	- 개인화 분석: 프로필 기반 맞춤형 치료
	- 발달 추적: 장기적 발전 모니터링

	### 4️⃣ 대본 기반 녹음
	- 카테고리별 대본: 일상 루틴, 놀이 활동, 감정 표현 등
	- 체계적 연습: 가이드된 대화 상황
	- 피드백 제공: 즉시 분석 결과 확인

	### 5️⃣ 3단계 변환 시스템
	\| 단계 \| 특징 \| 예시 \|
	\|------\|------\|------\|
	\| L1 \| 기본 수준 \| "물 주세요" \|
	\| L2 \| 확장 수준 \| "차가운 물 주세요" \|
	\| L3 \| 자기표현 수준 \| "지금 목이 말라서 차가운 물이 필요해요" \|

	---

	## 🔧 기술 스택

	### 백엔드
	- Python 3.10+
	- Gradio 4.44.0 (웹 인터페이스)
	- SQLite3 (데이터 저장)

	### AI/ML
	- OpenAI GPT-4o-mini (자연어 이해/생성)
	- OpenAI Whisper (음성 인식)
	- OpenAI TTS (음성 합성)

	### 아키텍처
	- 하이브리드 감지: AI + 룰베이스 폴백
	- 다차원 분석: 5개 지표 기반 신뢰도 계산
	- 실시간 처리: < 3초 응답 시간

	---

	## 🎨 차별화 포인트

	### vs 기존 AAC 도구
	\| 구분 \| 기존 도구 \| Coconut AI \|
	\|------\|----------\|-----------\|
	\| 접근성 \| 높은 비용 \| 무료 웹 접근 \|
	\| 즉시성 \| 제한적 \| 실시간 대응 \|
	\| 데이터 추적 \| 없음 \| 장기 발달 추적 \|
	\| AI 활용 \| 제한적 \| 고도화된 AI \|

	### vs 기존 언어치료
	\| 구분 \| 대면 치료 \| Coconut AI \|
	\|------\|----------\|-----------\|
	\| 접근성 \| 병원 방문 \| 가정에서 사용 \|
	\| 빈도 \| 주 1-2회 \| 24/7 가용 \|
	\| 비용 \| 높음 \| 무료 \|
	\| 데이터 기반 \| 제한적 \| 체계적 추적 \|

	### 기술적 차별화
	1. 맥락 기반 분석: 상황 정보 통합
	2. 불확실성 표시: 신뢰도별 색상 코딩
	3. 단계별 전환: L1/L2/L3 명확 구분
	4. 보안 강화: 토큰 제어, 입력 검증, 프롬프트 주입 방지

	---

	## 📈 성장 전략

	### Phase 1 (완료) ✅
	- ✅ 사용성 개선: 빠른/상세 분석 모드
	- ✅ 불확실성 표시: 신뢰도 색상 코딩
	- ✅ 결과 표현 단순화: 핵심 메시지 강조

	### Phase 2 (진행 예정) 🔄
	- 🔲 인간 검증 루프: 보호자 수정/피드백
	- 🔲 긴급 상황 감지: 신뢰도 < 60% 경고
	- 🔲 위험 케이스 가이드라인: 전문가 상담 권장

	### Phase 3 (계획 중) 📋
	- 🔲 세브란스/MoU 준비
	- 🔲 IRB 절차 문서화
	- 🔲 용어 정리 및 검증 사례 문서
	- 🔲 치료사 교육 자료

	### Phase 4 (장기) 🚀
	- 🔲 PWA 버전
	- 🔲 음성 녹음 UI 개선
	- 🔲 앱 스토어 배포 준비
	- 🔲 오프라인 지원

	### 확장 가능성
	- 다국어 지원: 글로벌 확장
	- 다양한 장애: 언어 발달 지연, 치매 등
	- B2B 모델: 병원, 학교, 치료 센터
	- B2C 모델: 개인 보호자 구독

	---

	## 🏥 임상 협력 계획

	### 현재 상태
	- 기반 기능 완성: 텍스트/음성 분석, 프로필 관리
	- 보안 강화: 토큰 제어, 입력 검증 완료
	- Phase 1 완료: 사용성 개선 완료

	### 다음 단계
	1. 세브란스 협력: MoU 체결, IRB 신청
	2. 임상 검증: 50-100명 표본 테스트
	3. 논문 발간: 효과성 검증 연구
	4. 용어 정리: 의료진 교육 자료 제작

	### 검증 전략
	- 정량적 지표: 반향어 감지 정확도, 보호자 만족도
	- 정성적 평가: 치료사 피드백, 임상 전문가 검토
	- 장기 추적: 6개월-1년 발달 데이터 수집

	---

	## 🔒 보안 및 안전장치

	### API 보안
	- 토큰 제어: 일일 500회, 200K 토큰 제한
	- 세션 제한: 세션당 100회 호출 제한
	- Rate Limiting: 무분별한 사용 방지

	### 입력 검증
	- 길이 제한: 최대 1000자
	- 프롬프트 주입 방지: 악의적 입력 탐지
	- 특수 문자 필터: 과도한 특수문자 차단

	### 데이터 보호
	- 로그 익명화: 개인정보 보호
	- 데이터 폐기: 일정 기간 후 삭제
	- HIPAA 준수: 의료 데이터 보호

	### 안전 가이드라인
	- 불확실성 표시: 신뢰도 < 70% 경고
	- 전문가 상담 권장: 심각한 케이스 알림
	- 보조 도구 명시: 의료 행위 아님 명확화

	---

	## 💰 재무 계획

	### 비용 구조
	- OpenAI API: ~$10/일 (200K 토큰 기준)
	- 인프라: Hugging Face Space (무료 - CPU Basic)
	- 개발: 자체 개발 (비용 최소화)

	### 수익 모델 (향후)
	1. B2B SaaS: 병원/학교 구독 (~$500/월)
	2. B2C 프리미엄: 개인 보호자 구독 (~$20/월)
	3. 라이선스: 의료 기관 판매
	4. 정부 지원: 보건복지부 정책 연계

	### 예상 비용 (연간)
	- API: $3,600/년
	- 인프라: $0 (무료 플랜)
	- 총 비용: ~$4,000/년

	---

	## 📊 주요 지표 (예상)

	### 현재 (MVP)
	- 정확도: 70-80% (보수적 추정)
	- 응답 시간: < 3초
	- 일일 사용: ~500회 (제한)

	### 목표 (1년)
	- 정확도: 90%+ (임상 검증 후)
	- 사용자: 1,000명+
	- 데이터: 10,000건+ 수집
	- 임상 협력: 세브란스 MoU 완료

	---

	## 🎯 ROI (투자 효과)

	### 사회적 임팩트
	- 보호자 스트레스 감소: 정량 측정 가능
	- 아동 의사소통 향상: 발달 지표 개선
	- 치료 효율성 증가: 대면 세션 + AI 보완

	### 비즈니스 가치
	- 시장 규모: 국내 자폐 아동 ~10,000명
	- 글로벌 확장: 1억+ 잠재 사용자
	- 기술 이전: 유사 장애 그룹 확장 가능

	---

	## 🚀 즉시 가능한 것들

	### 이미 완성된 기능 ✅
	1. 텍스트/음성 분석 시스템
	2. 3단계 변환 파이프라인
	3. 사용자 프로필 관리
	4. CARS 검사 통합
	5. 대본 기반 녹음
	6. 보안 및 토큰 제어
	7. 신뢰도 시각화

	### 곧 가능한 것들 🔄
	1. 세브란스 협력 시작
	2. 임상 데이터 수집
	3. 정확도 개선 (RLHF)
	4. 모바일 앱 출시

	---

	## 📞 다음 단계

	### 투자자/파트너에게
	1. IRB 신청 지원: 임상 검증 빠른 진행
	2. 데이터 수집 협력: 임상 현장 접근
	3. 마케팅 지원: 보호자 커뮤니티 홍보
	4. 전문가 연결: 언어치료 전문가 자문

	### 세브란스/MoU 협력
	- 임상 데이터: 실제 환자 테스트
	- 전문가 검증: 치료사 피드백
	- 논문 공동연구: 효과성 검증
	- 라인업 구축: 병원 내 배포

	---

	## 📝 요약

	Coconut AI는 자폐 아동의 반향어를 실시간으로 분석하여 기능적 의사소통으로 전환하는 혁신적 AI 도구입니다.

	### 왜 지금인가?
	- ✅ 기술적 기반 완성
	- ✅ 보안 강화 완료
	- ✅ 사용성 개선 완료
	- 🔄 임상 검증 준비 완료

	### 왜 Coconut AI인가?
	- 🎯 명확한 문제 정의
	- 💡 독특한 3단계 변환
	- 🔧 검증된 기술 스택
	- 🚀 확장 가능한 비즈니스 모델

	---

	Contact: [연락처 정보]
	Demo: http://localhost:7860
	Repository: [GitHub 링크]

	---
	이 자료는 Coconut AI 프로젝트 IR을 위한 요약 문서입니다.