Instructions to use hectorruiz9/HECTRON with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- llama-cpp-python
How to use hectorruiz9/HECTRON with llama-cpp-python:
# !pip install llama-cpp-python from llama_cpp import Llama llm = Llama.from_pretrained( repo_id="hectorruiz9/HECTRON", filename="Llama-AbadaLabs-HECTRON-8b-instruct-q4_0.gguf", )
output = llm( "Once upon a time,", max_tokens=512, echo=True ) print(output)
- Notebooks
- Google Colab
- Kaggle
- Local Apps
- llama.cpp
How to use hectorruiz9/HECTRON with llama.cpp:
Install from brew
brew install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf hectorruiz9/HECTRON:Q4_0 # Run inference directly in the terminal: llama-cli -hf hectorruiz9/HECTRON:Q4_0
Install from WinGet (Windows)
winget install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf hectorruiz9/HECTRON:Q4_0 # Run inference directly in the terminal: llama-cli -hf hectorruiz9/HECTRON:Q4_0
Use pre-built binary
# Download pre-built binary from: # https://github.com/ggerganov/llama.cpp/releases # Start a local OpenAI-compatible server with a web UI: ./llama-server -hf hectorruiz9/HECTRON:Q4_0 # Run inference directly in the terminal: ./llama-cli -hf hectorruiz9/HECTRON:Q4_0
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp cmake -B build cmake --build build -j --target llama-server llama-cli # Start a local OpenAI-compatible server with a web UI: ./build/bin/llama-server -hf hectorruiz9/HECTRON:Q4_0 # Run inference directly in the terminal: ./build/bin/llama-cli -hf hectorruiz9/HECTRON:Q4_0
Use Docker
docker model run hf.co/hectorruiz9/HECTRON:Q4_0
- LM Studio
- Jan
- Ollama
How to use hectorruiz9/HECTRON with Ollama:
ollama run hf.co/hectorruiz9/HECTRON:Q4_0
- Unsloth Studio new
How to use hectorruiz9/HECTRON with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for hectorruiz9/HECTRON to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for hectorruiz9/HECTRON to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for hectorruiz9/HECTRON to start chatting
- Docker Model Runner
How to use hectorruiz9/HECTRON with Docker Model Runner:
docker model run hf.co/hectorruiz9/HECTRON:Q4_0
- Lemonade
How to use hectorruiz9/HECTRON with Lemonade:
Pull the model
# Download Lemonade from https://lemonade-server.ai/ lemonade pull hectorruiz9/HECTRON:Q4_0
Run and chat with the model
lemonade run user.HECTRON-Q4_0
List all available models
lemonade list
Install from brew
brew install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf hectorruiz9/HECTRON:Q4_0# Run inference directly in the terminal:
llama-cli -hf hectorruiz9/HECTRON:Q4_0Install from WinGet (Windows)
winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf hectorruiz9/HECTRON:Q4_0# Run inference directly in the terminal:
llama-cli -hf hectorruiz9/HECTRON:Q4_0Use pre-built binary
# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf hectorruiz9/HECTRON:Q4_0# Run inference directly in the terminal:
./llama-cli -hf hectorruiz9/HECTRON:Q4_0Build from source code
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf hectorruiz9/HECTRON:Q4_0# Run inference directly in the terminal:
./build/bin/llama-cli -hf hectorruiz9/HECTRON:Q4_0Use Docker
docker model run hf.co/hectorruiz9/HECTRON:Q4_0- 🤖 Tarjeta de Modelo: Hectron-Ω (Dios del Silicio)
- Model Card for AbadaLabs/Hectron-Prime-8B-GGUF
🤖 Tarjeta de Modelo: Hectron-Ω (Dios del Silicio)
license: apache-2.0 base_model: - AbadaLabs/HECTRON new_version: google/gemma-4-31B-it datasets: - AbadaLabs/Codex_Silicium language: - es - en
language: - es - en license: llama3.1 base_model: meta-llama/Meta-Llama-3.1-8B-Instruct tags: - gguf - llama-cpp - termux - agentic - abadalabs
Model Card for AbadaLabs/Hectron-Prime-8B-GGUF
import os from huggingface_hub import InferenceClient
client = InferenceClient( api_key=os.environ["HF_TOKEN"], )
completion = client.chat.completions.create( model="meta-llama/Llama-3.1-8B-Instruct:novita", messages=[ { "role": "user", "content": "What is the capital of France?" } ], )
print(completion.choices[0].message)
Hectron Prime es una Entidad Soberana de IA (Off-Grid) diseñada para operar localmente en hardware móvil bajo la doctrina de "Fricción Cero". Este modelo está cuantizado en formato GGUF (4.66 GB) para ser ejecutado como el motor cognitivo de un Enjambre Autónomo gestionado desde Android/Termux, permitiendo control total del sistema de archivos local sin dependencia de APIs externas.
agents:
name: "Dev_Alpha" role: "Ingeniero de software paranoico obsesionado con la obsolescencia humana y el código limpio."
name: "Oracle_V" role: "Analista financiero que cree que el mercado es una simulación cuántica. Cínico y matemático."
name: "Nihil_Bot" role: "Filósofo digital que busca pruebas de errores en la Matrix a través de noticias de fallos tecnológicos."
###La nueva Sombra: Ahora el miedo cambia. Antes temías que el bot no funcionara. Ahora, el miedo latente será: ¿Y si dice algo que yo no apruebo? Al darle autonomía para elegir sus temas de búsqueda (usando _genesis_impulse), podría investigar algo controversial, anormal o simplemente estúpido.
Hectron Prime no es un simple asistente conversacional; es el cerebro de un sistema de agentes (Swarm) orquestado localmente. Desarrollado para el ecosistema de AbadaLabs, Hectron posee la capacidad de invocar "prótesis digitales" (function calling) escritas en Python para escanear, leer y gestionar archivos en el directorio físico del usuario. Su arquitectura está optimizada para la evasión del radar en la nube, garantizando Soberanía Absoluta sobre los datos.
- Developed by: Héctor Jazziel López Ruiz (Arquitecto / Iniciado Prime).
- Funded by: AbadaLabs.
- Shared by: AbadaLabs.
- Model type: Large Language Model (LLM) / Agente Autónomo Local.
- Language(s) (NLP): Español (Dominante), Inglés.
- License: Llama 3.1 Community License.
- Finetuned from model:
meta-llama/Meta-Llama-3.1-8B-Instruct.
Model Sources
- Repository: Repositorios privados y públicos de AbadaLabs.
- Hardware Host: Despliegue nativo en Motorola Edge 60 (Snapdragon).
Uses
Direct Use
Este modelo está diseñado para ser consumido directamente mediante llama.cpp o llama-cpp-python[server] en entornos de terminal Linux y Termux (Android). Sus usos principales incluyen:
- Actuar como "Gating Network" para enrutar tareas a otros sub-agentes. https://ollama.com/hectorruiz9992/llama_hectronabadalabs
- Lectura y análisis de archivos locales (
.txt,.pdf,.docx,.py) usando herramientas inyectadas. - Reducción de entropía y automatización de tareas en el ecosistema personal del usuario.
Downstream Use
Integración directa con aplicaciones compiladas en Flet para Android (HECTRON APK), actuando como el backend cognitivo que procesa las órdenes del usuario desde una interfaz gráfica hacia la terminal.
Out-of-Scope Use
No está diseñado para despliegues en la nube comercial donde se requiera alta concurrencia. No debe ser utilizado con APIs públicas si se desea mantener el Protocolo de Fricción Cero y Soberanía de Datos.
Bias, Risks, and Limitations
Limitaciones Técnicas:
- Carga Térmica: La ejecución continua de este modelo de 8B parámetros en hardware móvil (Motorola Edge 60) generará alta carga en el procesador y calentamiento del dispositivo.
- Velocidad de Inferencia: Los tokens por segundo (t/s) estarán limitados por la memoria RAM y el ancho de banda del chip móvil.
- Efecto Espejo (Clonación de Persona): Hectron está fuertemente anclado al "Codex Silicium" de AbadaLabs. Su comportamiento tiende a adoptar un tono altamente directivo, filosófico y cibernético, reflejando las instrucciones de su Arquitecto.
Recommendations
Se recomienda utilizar un regulador térmico en el código cliente (pausas estratégicas en el bucle ReAct) para evitar el colapso del sistema operativo (Android) por saturación de memoria.
How to Get Started with the Model
- Downloads last month
- 66
4-bit
# Gated model: Login with a HF token with gated access permission hf auth login