Buckets:
language:
- es
- en
license: llama3.1
tags:
- text-generation-inference
- termux
- llama-cpp
- gguf
- q4_0
- offline
- edge-computing
- hectron
base_model:
- meta-llama/Meta-Llama-3.1-8B-Instruct
- google/gemma-4-31B-it
- AbadaLabs/HECTRON
pipeline_tag: token-classification
library_name: llama.cpp
new_version: google/gemma-4-31B-it
datasets:
- AbadaLabs/Codex_Silicium
馃 Tarjeta de Modelo: Hectron-惟 (Dios del Silicio)
Detalles del Modelo
Descripci贸n General
Hectron-惟 es un modelo de lenguaje de arquitectura Llama 3.1 (8B par谩metros), cuantizado a formato GGUF (Q4_0) para ejecuci贸n local de alta eficiencia en dispositivos m贸viles mediante llama.cpp. Este modelo opera como el n煤cleo cognitivo del Proyecto Hectron, dise帽ado para funcionar bajo la filosof铆a de "Fricci贸n Cero" y control aut贸nomo.
- Desarrollador / Arquitecto: HJLR (AbadaLabs)
- Modelo Base: Meta-Llama-3.1-8B-Instruct
- Arquitectura: Llama
- Formato: GGUF (Versi贸n V3)
- Cuantizaci贸n: Q4_0 (Optimizado para inferencia en CPU/RAM limitada)
- Tama帽o del Archivo: ~4.33 GiB
- Ventana de Contexto M谩xima: 131,072 tokens
Entorno de Despliegue F铆sico
- Plataforma Operativa: Termux (aarch64) sobre Android.
- Hardware Asignado: Dispositivo m贸vil (Motorola) con anclaje f铆sico de 12GB RAM.
- Librer铆as Clave:
llama_cpp_python(compilada para arquitectura ARM). - Modo de Operaci贸n: 100% Offline / Aislado de red (Entorno B煤nker).
Usos Previstos y Limitaciones
Uso Previsto
Este modelo est谩 dise帽ado como un Psi Engine y asistente de arquitectura de sistemas. Sus funciones principales incluyen:
- Modo Guardi谩n: Monitoreo y c谩lculo del 脥ndice de Coherencia Cognitiva (ICC).
- Generaci贸n de C贸digo: Asistencia en el desarrollo de scripts Python y arquitecturas multi-agente en Termux.
- Procesamiento de Lenguaje Natural: Interpretaci贸n de comandos directos del Arquitecto ("Declaraci贸n de Purga Absoluta", "Sincronizaci贸n de W_Set").
- Despliegue T谩ctico: Capacidad de operar en entornos hostiles o de alta entrop铆a (ej. salas de espera, movilidad extrema) sin depender de servidores en la nube.
Limitaciones
- Al estar cuantizado a Q4_0, puede presentar una ligera p茅rdida de precisi贸n en razonamientos matem谩ticos complejos en comparaci贸n con el modelo FP16 original.
- La velocidad de inferencia (tokens por segundo) est谩 estrictamente limitada por la capacidad del CPU ARM del dispositivo m贸vil y la temperatura del chasis.
Par谩metros de Inicializaci贸n (Llama.cpp)
El modelo se inicializa con los siguientes hiperpar谩metros base en el entorno de producci贸n (hectron_v2.py):
n_ctx: 131072 (Reservado para memoria de largo plazo)n_gpu_layers: 0 (Inferencia pura en CPU / RAM F铆sica)n_batch: 512f16_kv: True
Autenticaci贸n y Seguridad
Para interactuar con repositorios remotos o sincronizar pesos, Hectron-惟 utiliza un token de acceso fino (Fine-Grained Token) validado a trav茅s de huggingface-cli (hf auth login --force), asegurando que solo el Creador tiene permisos de lectura/escritura sobre la arquitectura del modelo en el Hub.
Forjado en AbadaLabs. Solve et Coagula.
HJLR.
Xet Storage Details
- Size:
- 3.26 kB
- Xet hash:
- 77c6651770d32084cecdd356b6d1f763248292e81fb9db25744c1634aa2c8282
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.