🇷🇺 Russian Estimate Processor (Qwen3.5-4B Fine-tuned)
Модель для классификации позиций строительных смет по разделам шаблона.
На вход подается наименование позиции и список возможных категорий. На выходе модель возвращает индекс наиболее подходящей категории в формате JSON.
Формат промптов, использованных при обучении, находится в папке prompts репозитория.
🔧 Возможности
- Классификация позиций смет
- Работа с большим списком категорий
- Вывод строго в формате JSON
📥 Формат входа
Верни индекс категории на основе наименования позиции и справочника. Ищи наиболее узкую категорию если подходят несколько. Верни в формате JSON: {"category_index": 0}
Справочник: {"0":"Подготовка территории строительства","1":"Вырубка деревьев и кустарников"}
Позиция: "Вырубка кустарников с последующей ручной переноской"
Ответ:
📤 Пример формата выхода
{
"category_index": 17
}
🚀 Пример использования
from transformers import pipeline
pipe = pipeline(
"text-generation",
model="GreenMap/qwen3.5-4b-ru-estimate-engine",
tokenizer="GreenMap/qwen3.5-4b-ru-estimate-engine",
device=0,
)
guide = {
"0": "Подготовка территории строительства",
"1": "Вырубка деревьев и кустарников",
"2": "Благоустройство и озеленение территории"
}
item = "Вырубка кустарников с последующей ручной переноской"
# Промпт лучше загружать из файла
prompt = (
"Верни индекс категории на основе наименования позиции и справочника. "
"Ищи наиболее узкую категорию если подходят несколько. "
'Верни в формате JSON: {"category_index": 0}\n'
f"Справочник: {guide}\n"
f'Позиция: "{item}"\n'
"Ответ:\n"
)
result = pipe(
prompt,
max_new_tokens=32,
do_sample=False,
)
output = result[0]["generated_text"]
json_part = output.split("Ответ:\n")[-1].strip()
print(json_part)
⚙️ Рекомендуемые параметры
max_new_tokens=32
do_sample=False
Рекомендуется поддерживать формат промпта ближе к тому что указан в разделе "Формат входа"
🏋️ Обучение
- Базовая модель:
Qwen/Qwen3.5-4B-Base - Тип: full fine-tuning
- Обучена на датасете классификации позиций строительных смет
- Количество примеров: 1000
- Количество категорий в справочнике: до 115
- Формат ответа: JSON
📌 Применение
- Классификация позиций смет
- Downloads last month
- -