Buckets:
| Name | Size | Uploaded | Xet hash |
|---|---|---|---|
| .gitattributes | 1.52 kB xet | 818ba6de | |
| README.md | 2.15 kB xet | 78566df8 | |
| config.json | 751 Bytes xet | d8361e6e | |
| generation_config.json | 240 Bytes xet | ec6dfc09 | |
| merges.txt | 653 Bytes xet | a3b68c2d | |
| model.safetensors | 501 MB xet | 297edd41 | |
| vocab.json | 3.34 kB xet | 0cf780cd |
Baro: Inteligencia Artificial para Programación
Baro es un modelo de lenguaje a gran escala desarrollado desde cero por Industrias Kor. Su objetivo principal es asistir en tareas de programación, generación de código y resolución de problemas técnicos en diversos lenguajes.
Descripción del Modelo
Baro utiliza una arquitectura Transformer decodificador-únicamente, optimizada para la predicción secuencial de código. A diferencia de otros modelos generales, Baro ha sido diseñado con un enfoque exclusivo en la sintaxis y semántica de los lenguajes de programación.
- Desarrollado por: Industrias Kor
- Tipo de Modelo: Transformer Decoder-only
- Tarea Principal: Generación de Código (Code Generation)
- Lenguajes Soportados: Multilingüe (Python, JavaScript, C++, Java, etc.)
Arquitectura
La arquitectura de Baro se basa en los siguientes parámetros técnicos:
| Parámetro | Valor |
|---|---|
| Capas | 12 |
| Cabezas de Atención | 12 |
| Dimensión de Embedding | 768 |
| Ventana de Contexto | 2048 tokens |
| Vocabulario | 50,257 tokens |
Uso
Puedes cargar el modelo Baro utilizando la biblioteca transformers de Hugging Face:
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "Darveht/Baro"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
# Ejemplo de generación de código
prompt = "def calculate_factorial(n):"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_length=50)
print(tokenizer.decode(outputs[0]))
Entrenamiento
Baro ha sido pre-entrenado en un corpus masivo de código fuente, enfocado en la precisión sintáctica y la eficiencia algorítmica. El proceso de entrenamiento utiliza técnicas avanzadas de modelado de lenguaje causal (CLM).
Licencia
Este modelo se distribuye bajo la licencia MIT.
Desarrollado con orgullo por Industrias Kor.
- Total size
- 501 MB
- Files
- 7
- Last updated
- May 25
- Pre-warmed CDN
- US EU US EU