TimeSorter — 한국어 할 일 우선순위 정렬 비서

Qwen3.5-4B 기반 LoRA 어댑터 모음. 사용자가 제출한 할 일 목록을 긴급도·중요도·의존성·시간 제약 4축으로 채점해 우선순위를 결정합니다.

모델 설명

스마트폰·PC에서 "오늘 할 일"을 입력하면 AI가 맥락을 이해해 실행 순서를 제안하는 개인 비서 코어 모델입니다.

단순 키워드 정렬이 아닌, 페르소나(직장인·학생·부모 등)와 4가지 축을 기반으로 각 태스크를 1–5점으로 채점하고 그 근거를 함께 제시합니다.

입력: "임원 보고서 마감(내일), 팀 회의(오후 2시), 점심 약속, 메일 답장 3건"

출력:
1) 임원 보고서 마감  [긴급5·중요5·의존4·시간2] — 내일 마감, 핵심 업무
2) 팀 회의(오후 2시) [긴급4·중요4·의존3·시간4] — 고정 시각, 후속 블로킹
3) 메일 답장 3건     [긴급4·중요3·의존2·시간1] — 긴급하나 고정 시각 없음
4) 점심 약속         [긴급2·중요2·의존1·시간3] — 유연 조정 가능

어댑터 목록

폴더	스키마	학습 환경	train_loss	acc@ep5	JSON 출력
`sft_mac_v1/`	v1 자유 텍스트	Mac MPS	1.295	76.5%	—
`sft_mac_v2/`	v2 4축 JSON	Mac MPS	0.641	90.0%	✓
`sft_rtx12g_4b_v1/`	v1 자유 텍스트	RTX 12GB	—	—	—
`sft_rtx12g_4b_v2/`	v2 4축 JSON	RTX 12GB	—	—	✓
`sft_rtx12g_4b_v2_mlx/`	v2 4축 JSON	RTX → MLX 변환	—	—	✓
`dpo_rtx12g_4b/`	v2 4축 JSON	RTX 12GB DPO	—	—	✓

권장: sft_mac_v2/ (Mac 재현 가능) 또는 sft_rtx12g_4b_v2/ (RTX 최고 성능)

출력 형식 (v2 JSON)

{
  "tasks": [
    {"id": 1, "text": "임원 보고서 마감"},
    {"id": 2, "text": "팀 회의(오후 2시)"}
  ],
  "priority_order": [1, 2],
  "scores": [
    {
      "task_id": 1,
      "urgency": 5,
      "importance": 5,
      "dependency": 4,
      "time_constraint": 2,
      "reason": "내일 마감, 고객사 핵심 업무"
    },
    {
      "task_id": 2,
      "urgency": 4,
      "importance": 4,
      "dependency": 3,
      "time_constraint": 4,
      "reason": "오후 고정 시각, 후속 작업 입력"
    }
  ]
}

사용법

from peft import PeftModel
from transformers import AutoTokenizer, AutoModelForCausalLM

base_model = "Qwen/Qwen3.5-4B"
adapter_path = "pieroot/TimeSorter-qwen3-lora/sft_mac_v2"  # 또는 원하는 어댑터

tokenizer = AutoTokenizer.from_pretrained(base_model)
model = AutoModelForCausalLM.from_pretrained(base_model, torch_dtype="auto")
model = PeftModel.from_pretrained(model, adapter_path)

system_prompt = """당신은 한국어 일정 관리 전문 AI입니다.
사용자가 제공한 할 일 목록을 분석하여 다음 4가지 축으로 각 태스크를 1-5점으로 평가하고,
우선순위를 JSON 형식으로 출력하세요.

평가 축:
- urgency (긴급도): 즉각적인 처리 필요성
- importance (중요도): 목표 달성에 대한 기여도
- dependency (의존성): 다른 태스크 차단 여부
- time_constraint (시간 제약): 특정 시각/마감 고정 여부"""

user_input = "보고서 마감(내일), 팀 회의(오후 2시), 메일 답장 3건, 점심 약속"

messages = [
    {"role": "system", "content": system_prompt},
    {"role": "user", "content": f"페르소나: 직장인\n\n할 일 목록:\n{user_input}"}
]

text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(text, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.1)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))

또는 CLI로:

git clone https://github.com/jung-geun/TimeSorter
cd TimeSorter
make setup-mac  # 또는 setup-dgx

uv run python -m timesorter.infer \
  --adapter pieroot/TimeSorter-qwen3-lora/sft_mac_v2 \
  --schema-version v2 \
  --persona "직장인" \
  --prompt "보고서 마감(내일), 팀 회의(오후 2시), 메일 답장 3건"

학습 설정

항목	값
베이스 모델	Qwen/Qwen3.5-4B
어댑터	LoRA (r=8, alpha=16, dropout=0.05)
학습 방식	SFT (TRL SFTTrainer) → DPO
데이터셋	scheduler_v2_combined (10,958샘플 중 300 샘플)
에폭	5
학습률	2e-5, cosine decay
배치 (eff)	8 (bs=1 × grad_accum=8)
max_seq_length	1024

v2 학습 커브 (Mac MPS, sft_mac_v2)

epoch	loss	token_accuracy
0.13	1.541	66.5%
1.00	0.993	77.6%
1.59	0.585	87.0%
2.00	0.534	88.1%
3.00	0.427	89.7%
5.00	0.415	90.0%

데이터셋

scheduler_v2_combined (10,958행): GPT-4o로 생성한 한국어 일정 + 4축 JSON 응답
nvidia/Nemotron-Personas-Korea: 직업·연령·라이프스타일별 페르소나 다양화
dpo_pairs_v2: 선호/비선호 응답 쌍 (DPO 학습용)

라이선스

Apache 2.0 (베이스 모델 Qwen3.5-4B 라이선스 준수)

인용

@misc{timesorter2025,
  author    = {jung-geun},
  title     = {TimeSorter: Korean Task Priority Sorting via Qwen3.5-4B LoRA},
  year      = {2025},
  publisher = {Hugging Face},
  url       = {https://huggingface.co/pieroot/TimeSorter-qwen3-lora}
}

Downloads last month: -

Model tree for pieroot/TimeSorter-qwen3-lora

Base model

Qwen/Qwen3.5-4B-Base

Finetuned

Qwen/Qwen3.5-4B

Finetuned

(424)

this model

Dataset used to train pieroot/TimeSorter-qwen3-lora

Evaluation results

Token Accuracy (epoch 5)
self-reported

0.900