BitNet / README.md
ayaxrojo's picture
Upload README.md with huggingface_hub
3daa71a verified
# ⚖️ BitNet-SCJN-3.2B: Asistente Legal Mexicano (1.58-bit GGUF)
Este modelo es un asistente legal especializado en la **Jurisprudencia de la Suprema Corte de Justicia de la Nación (SCJN)** de México. Utiliza la arquitectura revolucionaria **BitNet b1.58 (ternaria)** para lograr una eficiencia extrema sin sacrificar la precisión en el razonamiento jurídico.
## 🚀 Innovaciones Técnicas
- **Arquitectura:** BitNet b1.58-bit (Pesos ternarios: {-1, 0, 1}).
- **Compresión:** Reducción del tamaño del modelo de ~14GB (FP16) a solo **1.4 GiB**.
- **Inferencia Optimizada:** Totalmente compatible con **TurboQuant** (KV Cache Quantization) y **Flash Attention**, permitiendo procesar contextos legales extensos en hardware de consumo.
- **Formato:** GGUF (optimizado para `llama.cpp` y `bitnet.cpp`).
## 📊 Datos de Entrenamiento
El modelo ha sido fine-tuneado mediante una época completa sobre un dataset curado de:
- **51,272 registros** oficiales de la SCJN.
- Tesis aisladas y jurisprudenciales de la Época actual.
- Estructura de datos optimizada para RAG (Retrieval-Augmented Generation).
## 🛠️ Cómo usar (Inferencia con llama.cpp)
Para obtener el máximo rendimiento y utilizar las optimizaciones de **TurboQuant**, se recomienda el siguiente comando:
```bash
./llama-cli -m asistente_legal_bitnet.gguf \
-p "### Sistema: Eres un Abogado Senior experto en la Jurisprudencia de la SCJN.\n### Consulta: ¿Cuál es el derecho a la privacidad?\n### Dictamen Legal:" \
-n 1024 \
-fa \
-ctk q4_0 -ctv q4_0 \
--temp 0.2 \
--repeat-penalty 1.15
```
### Parámetros Clave:
- `-fa`: Habilita Flash Attention.
- `-ctk q4_0 -ctv q4_0`: Activa la cuantización de caché KV (TurboQuant) para manejar contextos largos de jurisprudencia con un 50% menos de RAM.
## ⚖️ Disclaimer Legal
Este modelo es una herramienta de asistencia y apoyo para profesionales del derecho. Las respuestas generadas deben ser validadas por un abogado titulado y no constituyen asesoría legal vinculante.
---
**Desarrollado con ❤️ por la comunidad de IA Legal Mexicana.**