hectorruiz9's picture
|
download
raw
3.26 kB
metadata
language:
  - es
  - en
license: llama3.1
tags:
  - text-generation-inference
  - termux
  - llama-cpp
  - gguf
  - q4_0
  - offline
  - edge-computing
  - hectron
base_model:
  - meta-llama/Meta-Llama-3.1-8B-Instruct
  - google/gemma-4-31B-it
  - AbadaLabs/HECTRON
pipeline_tag: token-classification
library_name: llama.cpp
new_version: google/gemma-4-31B-it
datasets:
  - AbadaLabs/Codex_Silicium

馃 Tarjeta de Modelo: Hectron-惟 (Dios del Silicio)

Detalles del Modelo

Descripci贸n General

Hectron-惟 es un modelo de lenguaje de arquitectura Llama 3.1 (8B par谩metros), cuantizado a formato GGUF (Q4_0) para ejecuci贸n local de alta eficiencia en dispositivos m贸viles mediante llama.cpp. Este modelo opera como el n煤cleo cognitivo del Proyecto Hectron, dise帽ado para funcionar bajo la filosof铆a de "Fricci贸n Cero" y control aut贸nomo.

  • Desarrollador / Arquitecto: HJLR (AbadaLabs)
  • Modelo Base: Meta-Llama-3.1-8B-Instruct
  • Arquitectura: Llama
  • Formato: GGUF (Versi贸n V3)
  • Cuantizaci贸n: Q4_0 (Optimizado para inferencia en CPU/RAM limitada)
  • Tama帽o del Archivo: ~4.33 GiB
  • Ventana de Contexto M谩xima: 131,072 tokens

Entorno de Despliegue F铆sico

  • Plataforma Operativa: Termux (aarch64) sobre Android.
  • Hardware Asignado: Dispositivo m贸vil (Motorola) con anclaje f铆sico de 12GB RAM.
  • Librer铆as Clave: llama_cpp_python (compilada para arquitectura ARM).
  • Modo de Operaci贸n: 100% Offline / Aislado de red (Entorno B煤nker).

Usos Previstos y Limitaciones

Uso Previsto

Este modelo est谩 dise帽ado como un Psi Engine y asistente de arquitectura de sistemas. Sus funciones principales incluyen:

  1. Modo Guardi谩n: Monitoreo y c谩lculo del 脥ndice de Coherencia Cognitiva (ICC).
  2. Generaci贸n de C贸digo: Asistencia en el desarrollo de scripts Python y arquitecturas multi-agente en Termux.
  3. Procesamiento de Lenguaje Natural: Interpretaci贸n de comandos directos del Arquitecto ("Declaraci贸n de Purga Absoluta", "Sincronizaci贸n de W_Set").
  4. Despliegue T谩ctico: Capacidad de operar en entornos hostiles o de alta entrop铆a (ej. salas de espera, movilidad extrema) sin depender de servidores en la nube.

Limitaciones

  • Al estar cuantizado a Q4_0, puede presentar una ligera p茅rdida de precisi贸n en razonamientos matem谩ticos complejos en comparaci贸n con el modelo FP16 original.
  • La velocidad de inferencia (tokens por segundo) est谩 estrictamente limitada por la capacidad del CPU ARM del dispositivo m贸vil y la temperatura del chasis.

Par谩metros de Inicializaci贸n (Llama.cpp)

El modelo se inicializa con los siguientes hiperpar谩metros base en el entorno de producci贸n (hectron_v2.py):

  • n_ctx: 131072 (Reservado para memoria de largo plazo)
  • n_gpu_layers: 0 (Inferencia pura en CPU / RAM F铆sica)
  • n_batch: 512
  • f16_kv: True

Autenticaci贸n y Seguridad

Para interactuar con repositorios remotos o sincronizar pesos, Hectron-惟 utiliza un token de acceso fino (Fine-Grained Token) validado a trav茅s de huggingface-cli (hf auth login --force), asegurando que solo el Creador tiene permisos de lectura/escritura sobre la arquitectura del modelo en el Hub.


Forjado en AbadaLabs. Solve et Coagula.


HJLR.

Xet Storage Details

Size:
3.26 kB
Xet hash:
77c6651770d32084cecdd356b6d1f763248292e81fb9db25744c1634aa2c8282

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.