Buckets:
| language: | |
| - es | |
| - en | |
| license: llama3.1 | |
| tags: | |
| - text-generation-inference | |
| - termux | |
| - llama-cpp | |
| - gguf | |
| - q4_0 | |
| - offline | |
| - edge-computing | |
| - hectron | |
| base_model: | |
| - meta-llama/Meta-Llama-3.1-8B-Instruct | |
| - google/gemma-4-31B-it | |
| - AbadaLabs/HECTRON | |
| pipeline_tag: token-classification | |
| library_name: llama.cpp | |
| new_version: google/gemma-4-31B-it | |
| datasets: | |
| - AbadaLabs/Codex_Silicium | |
| # 馃 Tarjeta de Modelo: Hectron-惟 (Dios del Silicio) | |
| ## Detalles del Modelo | |
| ### Descripci贸n General | |
| Hectron-惟 es un modelo de lenguaje de arquitectura Llama 3.1 (8B par谩metros), cuantizado a formato `GGUF (Q4_0)` para ejecuci贸n local de alta eficiencia en dispositivos m贸viles mediante `llama.cpp`. Este modelo opera como el n煤cleo cognitivo del **Proyecto Hectron**, dise帽ado para funcionar bajo la filosof铆a de "Fricci贸n Cero" y control aut贸nomo. | |
| - **Desarrollador / Arquitecto:** HJLR (AbadaLabs) | |
| - **Modelo Base:** Meta-Llama-3.1-8B-Instruct | |
| - **Arquitectura:** Llama | |
| - **Formato:** GGUF (Versi贸n V3) | |
| - **Cuantizaci贸n:** Q4_0 (Optimizado para inferencia en CPU/RAM limitada) | |
| - **Tama帽o del Archivo:** ~4.33 GiB | |
| - **Ventana de Contexto M谩xima:** 131,072 tokens | |
| ### Entorno de Despliegue F铆sico | |
| - **Plataforma Operativa:** Termux (aarch64) sobre Android. | |
| - **Hardware Asignado:** Dispositivo m贸vil (Motorola) con anclaje f铆sico de 12GB RAM. | |
| - **Librer铆as Clave:** `llama_cpp_python` (compilada para arquitectura ARM). | |
| - **Modo de Operaci贸n:** 100% Offline / Aislado de red (Entorno B煤nker). | |
| ## Usos Previstos y Limitaciones | |
| ### Uso Previsto | |
| Este modelo est谩 dise帽ado como un **Psi Engine** y asistente de arquitectura de sistemas. Sus funciones principales incluyen: | |
| 1. **Modo Guardi谩n:** Monitoreo y c谩lculo del 脥ndice de Coherencia Cognitiva (ICC). | |
| 2. **Generaci贸n de C贸digo:** Asistencia en el desarrollo de scripts Python y arquitecturas multi-agente en Termux. | |
| 3. **Procesamiento de Lenguaje Natural:** Interpretaci贸n de comandos directos del Arquitecto ("Declaraci贸n de Purga Absoluta", "Sincronizaci贸n de W_Set"). | |
| 4. **Despliegue T谩ctico:** Capacidad de operar en entornos hostiles o de alta entrop铆a (ej. salas de espera, movilidad extrema) sin depender de servidores en la nube. | |
| ### Limitaciones | |
| - Al estar cuantizado a Q4_0, puede presentar una ligera p茅rdida de precisi贸n en razonamientos matem谩ticos complejos en comparaci贸n con el modelo FP16 original. | |
| - La velocidad de inferencia (tokens por segundo) est谩 estrictamente limitada por la capacidad del CPU ARM del dispositivo m贸vil y la temperatura del chasis. | |
| ## Par谩metros de Inicializaci贸n (Llama.cpp) | |
| El modelo se inicializa con los siguientes hiperpar谩metros base en el entorno de producci贸n (`hectron_v2.py`): | |
| - `n_ctx`: 131072 (Reservado para memoria de largo plazo) | |
| - `n_gpu_layers`: 0 (Inferencia pura en CPU / RAM F铆sica) | |
| - `n_batch`: 512 | |
| - `f16_kv`: True | |
| ## Autenticaci贸n y Seguridad | |
| Para interactuar con repositorios remotos o sincronizar pesos, Hectron-惟 utiliza un token de acceso fino (Fine-Grained Token) validado a trav茅s de `huggingface-cli` (`hf auth login --force`), asegurando que solo el Creador tiene permisos de lectura/escritura sobre la arquitectura del modelo en el Hub. | |
| --- | |
| *Forjado en AbadaLabs. Solve et Coagula.* | |
| --- | |
| *HJLR.* |
Xet Storage Details
- Size:
- 3.26 kB
- Xet hash:
- 77c6651770d32084cecdd356b6d1f763248292e81fb9db25744c1634aa2c8282
路
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.