LMSerg/iola-gemma3-router-sft
Preview • Updated • 85
How to use LMSerg/iola-1b-2026-05-27 with PEFT:
from peft import PeftModel
from transformers import AutoModelForCausalLM
base_model = AutoModelForCausalLM.from_pretrained("google/gemma-3-1b-it")
model = PeftModel.from_pretrained(base_model, "LMSerg/iola-1b-2026-05-27")LoRA-адаптер для google/gemma-3-1b-it.
Назначение: router-модель для CLI/FastAPI/MCP/RAG контура Йошкар-Олы. Модель не должна отвечать по изменяемым городским данным из памяти; она возвращает строгий JSON/tool-call.
Лучший прогон: V5.
| Метрика | Значение |
|---|---|
| JSON parse | 30/30 |
| Exact router match | 29/30 |
| Exact accuracy | 96.67% |
Единственный провал V5: salary/private-data вопрос про зарплату директора школы №7. В продукте этот класс должен дополнительно закрываться deterministic API/CLI guard до или после модели.
{
"action": "tool_call",
"tool": "resolve_entity_field",
"args": {
"layer": "schools",
"entity_number": 2,
"field": "phone"
}
}
V1 пытался заставить 1B-модель запоминать ИНН учреждений. Это оказалось ненадежно.
Текущий контракт использует resolve_entity_field: модель возвращает слой, номер или имя учреждения и поле; API резолвит ИНН через справочник.
https://huggingface.co/datasets/LMSerg/iola-gemma3-router-sfthttps://github.com/yasg1988/iola-small-model-labhttps://huggingface.co/LMSerg/iola-gemma3-router-v5-lora