Instructions to use ventarys/ventarys-3-pro with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Local Apps
- Unsloth Studio new
How to use ventarys/ventarys-3-pro with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for ventarys/ventarys-3-pro to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for ventarys/ventarys-3-pro to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for ventarys/ventarys-3-pro to start chatting
Load model with FastModel
pip install unsloth from unsloth import FastModel model, tokenizer = FastModel.from_pretrained( model_name="ventarys/ventarys-3-pro", max_seq_length=2048, )
Ventarys 3 Pro
Modelo de lenguaje ligero fine-tuneado basado en Gemma 2B Instruct, optimizado con Unsloth y cuantizado a 4-bit.
Ventarys 3 Pro es un modelo de lenguaje pequeño (SLM) desarrollado por Juanoto2012, basado en el modelo Gemma 2B Instruct de Google (lanzado en octubre de 2024). Está optimizado con herramientas de Unsloth para entrenamiento e inferencia acelerada, y cuantizado a 4-bit con bitsandbytes para reducir el consumo de recursos al mínimo.
Está diseñado para ejecutarse en equipos con recursos limitados (desde 4 GB de VRAM) y destaca en tareas de generación de texto, seguimiento de instrucciones y razonamiento básico, con mejoras específicas en rendimiento para español respecto al modelo base.
Distribuido bajo licencia MIT, permite uso comercial, modificación y distribución sin restricciones adicionales (siempre cumpliendo con los términos de uso de Gemma de Google).
✨ Características principales
| Característica | Detalle |
|---|---|
| Modelo base | Google Gemma 2B Instruct (octubre 2024) |
| Optimización | Unsloth para fine-tuning e inferencia acelerada, cuantización 4-bit NF4 con bitsandbytes |
| Ventana de contexto | 8,192 tokens (nativa de Gemma 2B) |
| Idiomas soportados | Español (mejorado), inglés, soporte básico para +10 idiomas |
| Consumo de recursos | 4-6 GB de VRAM en inferencia, 2-3 GB en fine-tuning con LoRA |
| Formatos disponibles | Pesos en 4-bit para Hugging Face/Transformers, GGUF (q4_k_m, q5_k_m) para Ollama/llama.cpp |
| Licencia | MIT (compatible con términos de uso de Gemma) |
🚀 Instalación y requisitos
Requisitos mínimos
- Python 3.9 o superior
- PyTorch 2.0 o superior
- 4 GB de VRAM (para inferencia) / 6 GB de VRAM (para fine-tuning)
- (Opcional) bitsandbytes para soporte de cuantización 4-bit
- (Opcional) Unsloth para fine-tuning acelerado
Instalar dependencias
# Para uso estándar con Transformers
pip install torch transformers bitsandbytes accelerate
# Para fine-tuning con Unsloth
pip install unsloth