SOVYN
/

SOVYN-85M

Text Generation

Eval Results (legacy)

Model card Files Files and versions

SOVYN-85M / README.md

SOVYN's picture

Update README.md

5c6711b verified 1 day ago

|

history blame contribute delete

2.98 kB

	---
	license: apache-2.0
	language:
	- ko
	tags:
	- reasoning
	- math
	- code
	- from-scratch
	- korean
	- gpt
	pipeline_tag: text-generation
	model-index:
	- name: SOVYN-85M
	results:
	- task:
	type: reasoning
	name: Custom Reasoning Benchmark
	metrics:
	- type: accuracy
	value: 86.5
	name: Overall Accuracy
	---

	# SOVYN-85M

	처음부터 학습한 85M 파라미터 한국어 추론 모델.

	수학, 코드 트레이싱, 논리, 물리, 화학, 생물, 지구과학, 한국사, 미적분 등 119개 카테고리의 문제를 단계별로 풀이한다.

	## 스펙

	\| \| \|
	\|---\|---\|
	\| 파라미터 \| 85.4M \|
	\| 아키텍처 \| GPT (Decoder-only) \|
	\| 레이어 \| 12 \|
	\| 어텐션 헤드 \| 12 \|
	\| 임베딩 차원 \| 768 \|
	\| 컨텍스트 길이 \| 512 \|
	\| 어휘 크기 \| 16,384 (BPE) \|
	\| 어텐션 \| Flash Attention (SDPA) \|
	\| 정밀도 \| float16 \|

	## 학습

	- 데이터: 591,261개 합성 추론 문제 (119 카테고리), 27.97M 토큰
	- 옵티마이저: AdamW (lr=3e-4, weight_decay=0.1)
	- 스케줄: Cosine decay + warmup 500 steps
	- 배치: 16 x 4 grad_accum = effective 64
	- 스텝: 20,000
	- GPU: RTX 5080 16GB
	- 학습 시간: ~4시간

	## 벤치마크

	자체 벤치마크 52문제, 10개 카테고리.

	\| 카테고리 \| 정확도 \|
	\|---------\|--------\|
	\| 산술 \| 100% \|
	\| 코드 트레이싱 \| 100% \|
	\| 숫자 성질 \| 100% \|
	\| 서술형 \| 100% \|
	\| 연산 우선순위 \| 88% \|
	\| 리스트 연산 \| 83% \|
	\| 괄호 연산 \| 80% \|
	\| 방정식 \| 80% \|
	\| 논리 \| 80% \|
	\| 수열 \| 33% \|
	\| 전체 \| 86.5% \|

	## 사용법

	```bash
	pip install torch safetensors tokenizers huggingface_hub
	```

	```python
	import torch
	from safetensors.torch import load_file
	from tokenizers import Tokenizer
	from huggingface_hub import hf_hub_download

	# 다운로드
	model_path = hf_hub_download("SOVYN/SOVYN-85M", "model.safetensors")
	tok_path = hf_hub_download("SOVYN/SOVYN-85M", "tokenizer.json")
	code_path = hf_hub_download("SOVYN/SOVYN-85M", "model.py")

	# 아키텍처 로드
	import importlib.util
	spec = importlib.util.spec_from_file_location("model", code_path)
	mod = importlib.util.module_from_spec(spec)
	spec.loader.exec_module(mod)

	# 모델 로드
	model = mod.SOVYN85M()
	state_dict = load_file(model_path)
	state_dict = {k: v.float() for k, v in state_dict.items()}
	model.load_state_dict(state_dict)
	model.eval()

	tokenizer = Tokenizer.from_file(tok_path)

	# 추론
	prompt = "문제: 3x + 7 = 22일 때, x의 값을 구하시오.\n풀이:\n"
	ids = torch.tensor([tokenizer.encode(prompt).ids])
	out = model.generate(ids, max_new_tokens=200, temperature=0.3)
	print(tokenizer.decode(out[0].tolist()))
	```

	## 프롬프트 형식

	```
	문제: {내용}
	풀이:
	```

	"풀이:" 이후를 생성. 단계별 풀이 + "답: {정답}" 형태로 출력.

	## 제한사항

	- 합성 데이터로만 학습. 자유 대화 불가.
	- 수열(등비/피보나치) 약함.
	- 컨텍스트 512 토큰 제한.

	## 라이선스

	Apache-2.0