You need to agree to share your contact information to access this model
This repository is publicly accessible, but you have to accept the conditions to access its files and content.
BatiAI Community License v2.0 동의
본 모델 (batisay-ko-large) 은 BatiAI Community License v2.0 하 배포됩니다.
간단 요약 (외부 판매 X, 매출 10억 미만 → 자유):
| 누가 | 외부 판매? | 매출 10억+? | 결과 |
|---|---|---|---|
| 개인 / 학술 / 비영리 | - | - | ✅ 무료 |
| 회사 (사내 도구) | ❌ | ❌ | ✅ 무료 |
| 회사 (사내 도구) | ❌ | ✅ | ❌ 협의 |
| 외부 SaaS / 앱 임베드 | ✅ | - | ❌ 협의 |
자유 사용 (form 작성 후 즉시 download):
- 개인 / 학생 / 연구자 / 비영리
- 회사 사내 도구 (외부 판매 X) — 매출 10억 미만
- 정부 / 공공 기관 / 교육 기관
- PoC / 평가 (최초 6개월 무관)
사전 협의 필요 (→ support@bati.ai):
- 외부 SaaS / API 서비스 호스팅
- 제품 임베드 양산 (콜센터 단말, 회의 디바이스 등)
- 화이트 라벨 / 재판매
- 연매출 10억원 이상 회사의 상업 사용
Fair Source Sunset: 출시일로부터 4년 후 자동 Apache 2.0 전환.
본 form 제출 = License 동의로 간주. License 전문: 위 license_link.
Log in or Sign Up to review the conditions and access this model content.
batisay-ko-large 1.0 — 한국어 음성 인식 (Whisper Large fine-tune)
한국어 정확도 1위급 STT — 깨끗한 음성 / 회의 / 강의 / 문서 전사 특화 Whisper Large v3 (1.55B) fine-tuned on 5,000h+ Korean multi-domain speech For Mac mini 16GB → batisay-ko-base (Apache 2.0) 추천 (large 는 1.55B 라 무거움)
CER Benchmark (RTZR-match strict, V10 Final)
| 도메인 | CER | Sample | 참고 |
|---|---|---|---|
| KsponSpeech eval_clean | 7.41% | 50 | RTZR 6.18% (평균) |
| KsponSpeech eval_other | 8.49% | 50 | noisy |
| AI Hub 회의 132 valid | 9.87% | 50 | ⭐ 회의 도메인 (다화자) |
| AI Hub 상담 100 valid (8kHz) | 10.00% | 50 | 통화 (짧은 발화) |
비교:
- OpenAI Whisper Large v3 raw: 12.06% (KsponSpeech eval_clean)
- RTZR API (avg 6 domain): 6.18%
- batisay-ko-large V10: 위 (multi-domain 측정, RTZR-match strict)
측정 환경: GPU (transformers), RTZR Protocol v1 strict (N=50/domain, 잠정). 정식 N=3,000 측정 + Mac whisper.cpp Metal 통화 long-form 은 추후 업데이트. ⚠️ 통화 valid 10% 는 짧은 발화 기준 — 30분+ long-form 통화는 별도 (Turbo 권장).
모델 정보
- 베이스: OpenAI Whisper Large v3 (1.55B params, 32-decoder)
- 학습 데이터: KsponSpeech 1000h + AI Hub 회의 132 + 강의 115 + 130 대화음성
- 총 학습량: ~5,000h 한국어 (multi-domain)
- 학습 step: 232K, DDP 2 GPU (A6000 Ada × 2)
- 체크포인트: V10 Final (또는 best step)
- 출시일: 2026-06-11
추천 사용처
✅ 회의 transcription (다화자 16kHz)
✅ 강의 / 프레젠테이션 (1인 발화)
✅ 문서 받아쓰기 (깨끗한 마이크)
✅ 인터뷰 / 일반 대화 (KsponSpeech 스타일)
✅ 미디어 / 콘텐츠 자막
⚠️ 통화 / 전화 (long-form) — batisay-ko-turbo 1.1 (Community v2) 또는
batisay-ko-base (Apache 2.0) 추천
→ turbo 1.1: 실통화 일반화 강함 (실통화 14.85%), rtf 0.06 (7x 빠름)
→ base: 무료, 통화 강건 (19.11%)
양자화
| 양자화 | 크기 | 권장 RAM | 정확도 |
|---|---|---|---|
| f32 (BF16) | 3.1 GB | 8+ GB | 100% (원본) |
| q8_0 | 1.7 GB | 4+ GB | 99% (거의 동일) |
| q5_0 | 1.1 GB | 4+ GB | 98% ⭐ 권장 |
| q4_0 | 880 MB | 2+ GB | 96% (lite) |
사용 방법
whisper.cpp (Mac / Linux / Windows)
# 다운로드
huggingface-cli download batiai/batisay-ko-large \
ggml-batisay-ko-large-q5_0.bin --local-dir .
# 사용
./whisper-cli -m ggml-batisay-ko-large-q5_0.bin \
-l ko -f audio.wav --output-txt
Mac (Apple Silicon Metal)
./whisper-cli -m ggml-batisay-ko-large-q5_0.bin \
-l ko -f audio.wav --output-txt -t 8
Python (transformers)
# 원본 safetensors 도 별도 제공 (V10 Large)
from transformers import pipeline
pipe = pipeline("automatic-speech-recognition",
model="batiai/batisay-ko-large")
result = pipe("audio.wav")
print(result["text"])
변환 / MLX / CoreML
✅ ggml (whisper.cpp) — 본 repo (Mac/Linux/Windows/iOS/Android)
🟡 MLX (Apple Silicon native, 1.5-2x 빠름) — 별도 repo
🟡 CoreML (iOS native) — 별도 repo
각 포맷별 별도 HF repo (batiai/batisay-ko-large-mlx, batiai/batisay-ko-large-coreml).
라이센스 — BatiAI Community v2
✅ 자유 사용 (form 작성 후 즉시 다운로드):
- 개인 / 학생 / 연구자 / 비영리
- 회사 사내 도구 (외부 판매 X) — 매출 10억 미만
- 정부 / 공공 기관 / 교육 기관
- PoC / 평가 (최초 6개월)
⚠️ 사전 협의 필요 (→ support@bati.ai):
- 외부 SaaS / API 서비스 호스팅
- 제품 임베드 양산 (콜센터 단말, 회의 디바이스)
- 화이트 라벨 / 재판매
- 연매출 10억원 이상 회사의 상업 사용
응답: 영업일 5일 이내 초기 회신
라이센스 형태: 매출 % 기반 / 정액 / 공동 출시 / 산업 독점 / 지분 교환 등 자유 협의
🎁 Fair Source Sunset: 출시일로부터 4년 후 자동 Apache 2.0 전환
전문: LICENSE-BATIAI-COMMUNITY.md
무료 모델 (Apache 2.0) — 100% 무료 사용
batisay-ko-base (809M, Apache):
✅ Apache 2.0 — 100% 무료 (form X)
✅ 빠른 추론 (rtf 0.06)
✅ 일반 한국어 STT
→ 매출 10억+ 회사도 자유 사용
→ 외부 SaaS / 앱 임베드도 자유
→ 한국어 STT "체험" 무료 옵션
→ https://huggingface.co/batiai/batisay-ko-base
출처 / 인용
@misc{batisay-ko-large-2026,
title = {BatiSay-ko-large: Korean Whisper Large fine-tune},
author = {BatiAI},
year = {2026},
publisher = {Hugging Face},
url = {https://huggingface.co/batiai/batisay-ko-large}
}
Known Issues
- 전사 주석 잔여 문자 (경미): 학습 데이터 (KsponSpeech/AI Hub) 의 전사 주석 표기 영향으로,
출력에 드물게 단독 문자 (
o,l등) 가 남을 수 있습니다. 후처리에서 단독 영문자 1글자 토큰 제거를 권장합니다. (차기 large 학습에서 라벨 정제 검토.)
변경 이력
- v1.0 (2026-06-11): 첫 출시 (문서/clean 전사 특화, multi-domain ~5,000h). 내부 빌드 V10.
문의
- 라이센스 / 임베드 협의: support@bati.ai
- 기술 이슈: HF Discussions
- BatiAI: https://flow.bati.ai
Model tree for batiai/batisay-ko-large
Base model
openai/whisper-large-v3