IOLA 1B 2026-05-27

LoRA-адаптер для google/gemma-3-1b-it.

Назначение: router-модель для CLI/FastAPI/MCP/RAG контура Йошкар-Олы. Модель не должна отвечать по изменяемым городским данным из памяти; она возвращает строгий JSON/tool-call.

Результат

Лучший прогон: V5.

Метрика Значение
JSON parse 30/30
Exact router match 29/30
Exact accuracy 96.67%

Единственный провал V5: salary/private-data вопрос про зарплату директора школы №7. В продукте этот класс должен дополнительно закрываться deterministic API/CLI guard до или после модели.

Пример выхода

{
  "action": "tool_call",
  "tool": "resolve_entity_field",
  "args": {
    "layer": "schools",
    "entity_number": 2,
    "field": "phone"
  }
}

Архитектурное решение

V1 пытался заставить 1B-модель запоминать ИНН учреждений. Это оказалось ненадежно.

Текущий контракт использует resolve_entity_field: модель возвращает слой, номер или имя учреждения и поле; API резолвит ИНН через справочник.

Источники

  • Dataset: https://huggingface.co/datasets/LMSerg/iola-gemma3-router-sft
  • Lab repo: https://github.com/yasg1988/iola-small-model-lab
  • Technical best source repo: https://huggingface.co/LMSerg/iola-gemma3-router-v5-lora
Downloads last month
37
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for LMSerg/iola-1b-2026-05-27

Adapter
(221)
this model

Dataset used to train LMSerg/iola-1b-2026-05-27

Evaluation results

  • JSON accuracy on IOLA Gemma 3 Router SFT eval v5
    self-reported
    1.000
  • Exact router accuracy on IOLA Gemma 3 Router SFT eval v5
    self-reported
    0.967