License: MIT Version Hugging Face GitHub

Ventarys 3 Pro

Modelo de lenguaje ligero fine-tuneado basado en Gemma 2B Instruct, optimizado con Unsloth y cuantizado a 4-bit.


Ventarys 3 Pro es un modelo de lenguaje pequeño (SLM) desarrollado por Juanoto2012, basado en el modelo Gemma 2B Instruct de Google (lanzado en octubre de 2024). Está optimizado con herramientas de Unsloth para entrenamiento e inferencia acelerada, y cuantizado a 4-bit con bitsandbytes para reducir el consumo de recursos al mínimo.

Está diseñado para ejecutarse en equipos con recursos limitados (desde 4 GB de VRAM) y destaca en tareas de generación de texto, seguimiento de instrucciones y razonamiento básico, con mejoras específicas en rendimiento para español respecto al modelo base.

Distribuido bajo licencia MIT, permite uso comercial, modificación y distribución sin restricciones adicionales (siempre cumpliendo con los términos de uso de Gemma de Google).


✨ Características principales

Característica Detalle
Modelo base Google Gemma 2B Instruct (octubre 2024)
Optimización Unsloth para fine-tuning e inferencia acelerada, cuantización 4-bit NF4 con bitsandbytes
Ventana de contexto 8,192 tokens (nativa de Gemma 2B)
Idiomas soportados Español (mejorado), inglés, soporte básico para +10 idiomas
Consumo de recursos 4-6 GB de VRAM en inferencia, 2-3 GB en fine-tuning con LoRA
Formatos disponibles Pesos en 4-bit para Hugging Face/Transformers, GGUF (q4_k_m, q5_k_m) para Ollama/llama.cpp
Licencia MIT (compatible con términos de uso de Gemma)

🚀 Instalación y requisitos

Requisitos mínimos

  • Python 3.9 o superior
  • PyTorch 2.0 o superior
  • 4 GB de VRAM (para inferencia) / 6 GB de VRAM (para fine-tuning)
  • (Opcional) bitsandbytes para soporte de cuantización 4-bit
  • (Opcional) Unsloth para fine-tuning acelerado

Instalar dependencias

# Para uso estándar con Transformers
pip install torch transformers bitsandbytes accelerate

# Para fine-tuning con Unsloth
pip install unsloth
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support