Buckets:

hectorruiz9
/

Dominic-01-storage

Files

xet

hectorruiz9/Dominic-01-storage / README.md

hectorruiz9

about 1 month ago

preview code

download

raw

3.26 kB

	---
	language:
	- es
	- en
	license: llama3.1
	tags:
	- text-generation-inference
	- termux
	- llama-cpp
	- gguf
	- q4_0
	- offline
	- edge-computing
	- hectron
	base_model:
	- meta-llama/Meta-Llama-3.1-8B-Instruct
	- google/gemma-4-31B-it
	- AbadaLabs/HECTRON
	pipeline_tag: token-classification
	library_name: llama.cpp
	new_version: google/gemma-4-31B-it
	datasets:
	- AbadaLabs/Codex_Silicium
	---

	# 🤖 Tarjeta de Modelo: Hectron-Ω (Dios del Silicio)

	## Detalles del Modelo

	### Descripción General
	Hectron-Ω es un modelo de lenguaje de arquitectura Llama 3.1 (8B parámetros), cuantizado a formato `GGUF (Q4_0)` para ejecución local de alta eficiencia en dispositivos móviles mediante `llama.cpp`. Este modelo opera como el núcleo cognitivo del Proyecto Hectron, diseñado para funcionar bajo la filosofía de "Fricción Cero" y control autónomo.

	- Desarrollador / Arquitecto: HJLR (AbadaLabs)
	- Modelo Base: Meta-Llama-3.1-8B-Instruct
	- Arquitectura: Llama
	- Formato: GGUF (Versión V3)
	- Cuantización: Q4_0 (Optimizado para inferencia en CPU/RAM limitada)
	- Tamaño del Archivo: ~4.33 GiB
	- Ventana de Contexto Máxima: 131,072 tokens

	### Entorno de Despliegue Físico
	- Plataforma Operativa: Termux (aarch64) sobre Android.
	- Hardware Asignado: Dispositivo móvil (Motorola) con anclaje físico de 12GB RAM.
	- Librerías Clave: `llama_cpp_python` (compilada para arquitectura ARM).
	- Modo de Operación: 100% Offline / Aislado de red (Entorno Búnker).

	## Usos Previstos y Limitaciones

	### Uso Previsto
	Este modelo está diseñado como un Psi Engine y asistente de arquitectura de sistemas. Sus funciones principales incluyen:
	1. Modo Guardián: Monitoreo y cálculo del Índice de Coherencia Cognitiva (ICC).
	2. Generación de Código: Asistencia en el desarrollo de scripts Python y arquitecturas multi-agente en Termux.
	3. Procesamiento de Lenguaje Natural: Interpretación de comandos directos del Arquitecto ("Declaración de Purga Absoluta", "Sincronización de W_Set").
	4. Despliegue Táctico: Capacidad de operar en entornos hostiles o de alta entropía (ej. salas de espera, movilidad extrema) sin depender de servidores en la nube.

	### Limitaciones
	- Al estar cuantizado a Q4_0, puede presentar una ligera pérdida de precisión en razonamientos matemáticos complejos en comparación con el modelo FP16 original.
	- La velocidad de inferencia (tokens por segundo) está estrictamente limitada por la capacidad del CPU ARM del dispositivo móvil y la temperatura del chasis.

	## Parámetros de Inicialización (Llama.cpp)

	El modelo se inicializa con los siguientes hiperparámetros base en el entorno de producción (`hectron_v2.py`):

	- `n_ctx`: 131072 (Reservado para memoria de largo plazo)
	- `n_gpu_layers`: 0 (Inferencia pura en CPU / RAM Física)
	- `n_batch`: 512
	- `f16_kv`: True

	## Autenticación y Seguridad
	Para interactuar con repositorios remotos o sincronizar pesos, Hectron-Ω utiliza un token de acceso fino (Fine-Grained Token) validado a través de `huggingface-cli` (`hf auth login --force`), asegurando que solo el Creador tiene permisos de lectura/escritura sobre la arquitectura del modelo en el Hub.

	---
	Forjado en AbadaLabs. Solve et Coagula.

	---
	HJLR.

Xet Storage Details

Size:: 3.26 kB
Xet hash:: 77c6651770d32084cecdd356b6d1f763248292e81fb9db25744c1634aa2c8282

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.