501 MB
7 files
Updated about 1 month ago
Name
Size
.gitattributes1.52 kB
xet
README.md2.15 kB
xet
config.json751 Bytes
xet
generation_config.json240 Bytes
xet
merges.txt653 Bytes
xet
model.safetensors501 MB
xet
vocab.json3.34 kB
xet
README.md

Baro: Inteligencia Artificial para Programación

Baro es un modelo de lenguaje a gran escala desarrollado desde cero por Industrias Kor. Su objetivo principal es asistir en tareas de programación, generación de código y resolución de problemas técnicos en diversos lenguajes.

Descripción del Modelo

Baro utiliza una arquitectura Transformer decodificador-únicamente, optimizada para la predicción secuencial de código. A diferencia de otros modelos generales, Baro ha sido diseñado con un enfoque exclusivo en la sintaxis y semántica de los lenguajes de programación.

  • Desarrollado por: Industrias Kor
  • Tipo de Modelo: Transformer Decoder-only
  • Tarea Principal: Generación de Código (Code Generation)
  • Lenguajes Soportados: Multilingüe (Python, JavaScript, C++, Java, etc.)

Arquitectura

La arquitectura de Baro se basa en los siguientes parámetros técnicos:

Parámetro Valor
Capas 12
Cabezas de Atención 12
Dimensión de Embedding 768
Ventana de Contexto 2048 tokens
Vocabulario 50,257 tokens

Uso

Puedes cargar el modelo Baro utilizando la biblioteca transformers de Hugging Face:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Darveht/Baro"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Ejemplo de generación de código
prompt = "def calculate_factorial(n):"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_length=50)
print(tokenizer.decode(outputs[0]))

Entrenamiento

Baro ha sido pre-entrenado en un corpus masivo de código fuente, enfocado en la precisión sintáctica y la eficiencia algorítmica. El proceso de entrenamiento utiliza técnicas avanzadas de modelado de lenguaje causal (CLM).

Licencia

Este modelo se distribuye bajo la licencia MIT.


Desarrollado con orgullo por Industrias Kor.

Total size
501 MB
Files
7
Last updated
May 25
Pre-warmed CDN
US EU US EU

Contributors