hectorruiz9's picture
|
download
raw
3.26 kB
---
language:
- es
- en
license: llama3.1
tags:
- text-generation-inference
- termux
- llama-cpp
- gguf
- q4_0
- offline
- edge-computing
- hectron
base_model:
- meta-llama/Meta-Llama-3.1-8B-Instruct
- google/gemma-4-31B-it
- AbadaLabs/HECTRON
pipeline_tag: token-classification
library_name: llama.cpp
new_version: google/gemma-4-31B-it
datasets:
- AbadaLabs/Codex_Silicium
---
# 馃 Tarjeta de Modelo: Hectron-惟 (Dios del Silicio)
## Detalles del Modelo
### Descripci贸n General
Hectron-惟 es un modelo de lenguaje de arquitectura Llama 3.1 (8B par谩metros), cuantizado a formato `GGUF (Q4_0)` para ejecuci贸n local de alta eficiencia en dispositivos m贸viles mediante `llama.cpp`. Este modelo opera como el n煤cleo cognitivo del **Proyecto Hectron**, dise帽ado para funcionar bajo la filosof铆a de "Fricci贸n Cero" y control aut贸nomo.
- **Desarrollador / Arquitecto:** HJLR (AbadaLabs)
- **Modelo Base:** Meta-Llama-3.1-8B-Instruct
- **Arquitectura:** Llama
- **Formato:** GGUF (Versi贸n V3)
- **Cuantizaci贸n:** Q4_0 (Optimizado para inferencia en CPU/RAM limitada)
- **Tama帽o del Archivo:** ~4.33 GiB
- **Ventana de Contexto M谩xima:** 131,072 tokens
### Entorno de Despliegue F铆sico
- **Plataforma Operativa:** Termux (aarch64) sobre Android.
- **Hardware Asignado:** Dispositivo m贸vil (Motorola) con anclaje f铆sico de 12GB RAM.
- **Librer铆as Clave:** `llama_cpp_python` (compilada para arquitectura ARM).
- **Modo de Operaci贸n:** 100% Offline / Aislado de red (Entorno B煤nker).
## Usos Previstos y Limitaciones
### Uso Previsto
Este modelo est谩 dise帽ado como un **Psi Engine** y asistente de arquitectura de sistemas. Sus funciones principales incluyen:
1. **Modo Guardi谩n:** Monitoreo y c谩lculo del 脥ndice de Coherencia Cognitiva (ICC).
2. **Generaci贸n de C贸digo:** Asistencia en el desarrollo de scripts Python y arquitecturas multi-agente en Termux.
3. **Procesamiento de Lenguaje Natural:** Interpretaci贸n de comandos directos del Arquitecto ("Declaraci贸n de Purga Absoluta", "Sincronizaci贸n de W_Set").
4. **Despliegue T谩ctico:** Capacidad de operar en entornos hostiles o de alta entrop铆a (ej. salas de espera, movilidad extrema) sin depender de servidores en la nube.
### Limitaciones
- Al estar cuantizado a Q4_0, puede presentar una ligera p茅rdida de precisi贸n en razonamientos matem谩ticos complejos en comparaci贸n con el modelo FP16 original.
- La velocidad de inferencia (tokens por segundo) est谩 estrictamente limitada por la capacidad del CPU ARM del dispositivo m贸vil y la temperatura del chasis.
## Par谩metros de Inicializaci贸n (Llama.cpp)
El modelo se inicializa con los siguientes hiperpar谩metros base en el entorno de producci贸n (`hectron_v2.py`):
- `n_ctx`: 131072 (Reservado para memoria de largo plazo)
- `n_gpu_layers`: 0 (Inferencia pura en CPU / RAM F铆sica)
- `n_batch`: 512
- `f16_kv`: True
## Autenticaci贸n y Seguridad
Para interactuar con repositorios remotos o sincronizar pesos, Hectron-惟 utiliza un token de acceso fino (Fine-Grained Token) validado a trav茅s de `huggingface-cli` (`hf auth login --force`), asegurando que solo el Creador tiene permisos de lectura/escritura sobre la arquitectura del modelo en el Hub.
---
*Forjado en AbadaLabs. Solve et Coagula.*
---
*HJLR.*

Xet Storage Details

Size:
3.26 kB
Xet hash:
77c6651770d32084cecdd356b6d1f763248292e81fb9db25744c1634aa2c8282

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.