neuralghost
/

darkforensic-7b

@@ -110,18 +110,53 @@ ollama --version       # debe imprimir "ollama version is X.Y.Z"
 **2. Descarga el GGUF Q4_K_M y el Modelfile** de este repo:
 ```bash
 mkdir darkforensic && cd darkforensic
-# Descarga el modelo (4.7 GB) y el Modelfile
-curl -L -o darkforensic-7b-v2-q4_k_m.gguf \
-  https://huggingface.co/neuralghost/darkforensic-7b/resolve/main/darkforensic-7b-v2-q4_k_m.gguf
-curl -L -o Modelfile \
-  https://huggingface.co/neuralghost/darkforensic-7b/raw/main/Modelfile
 ```
-(Alternativa: con `huggingface-cli download neuralghost/darkforensic-7b` —
-te baja todo el repo de golpe. Más cómodo si tienes la CLI instalada.)
 **3. Importa el modelo a Ollama**:
@@ -271,12 +306,14 @@ Con 4-bit cabe en ~6 GB de VRAM (RTX 3060 12 GB, RTX 4060 8 GB con stretching).
 | Síntoma | Causa probable | Solución |
 |---|---|---|
-| `ollama create` se queda colgado | El Modelfile referencia un GGUF que no existe en esa carpeta | Verifica que `darkforensic-7b-v2-q4_k_m.gguf` está en el mismo directorio que el `Modelfile` |
 | `Error: out of memory` al usarlo | Estás cargando fp16/bf16 en GPU pequeña, o varios modelos a la vez en Ollama | Usa Q4_K_M; `ollama stop` los otros modelos; o reduce `num_ctx` en el Modelfile (8192 → 4096) |
 | Respuestas muy lentas (< 2 tok/s) | Corriendo en CPU sin AVX2, o el modelo no cabe en RAM y está paginando a disco | Verifica `grep avx2 /proc/cpuinfo`; baja a 4 hilos con `OLLAMA_NUM_PARALLEL=1`; cierra otras apps con memoria pesada |
 | Responde en inglés cuando le hablas en castellano | Faltó el system prompt o el primer mensaje es muy corto | Asegúrate de pasar el system del Modelfile (Ollama lo aplica automáticamente con `ollama run`); con la API REST mándalo explícito |
 | "Permission denied" al ejecutar | Falta permisos en `~/.ollama` | `chmod -R u+rw ~/.ollama` |
 | El modelo alucina IOCs específicos (BTC addresses, hashes) | El modelo describe IOCs, NO los memoriza — por diseño | Es el comportamiento correcto, no un bug. Para IOCs verbatim necesitas el RAG sobre tu corpus indexado, no el LLM solo |
 ## Integración con un pipeline RAG (recomendado para producción)

 **2. Descarga el GGUF Q4_K_M y el Modelfile** de este repo:
+⭐ **Recomendado: usa `huggingface-cli`** (gestiona redirects de HF, hace
+resume si se corta la conexión, valida checksum):
 ```bash
 mkdir darkforensic && cd darkforensic
+# Instala el cliente HF si no lo tienes
+pip install -U "huggingface_hub[cli]"
+# En Debian/Ubuntu/Kali reciente puede pedir --break-system-packages
+# o usa --user en su lugar:
+#   pip install -U --user "huggingface_hub[cli]"
+# Descarga sólo los 2 archivos que necesitas (no todo el repo)
+huggingface-cli download neuralghost/darkforensic-7b \
+  darkforensic-7b-v2-q4_k_m.gguf Modelfile \
+  --local-dir . --local-dir-use-symlinks False
+# Verifica el tamaño (debe imprimir 4.4G — Hugging Face muestra 4.68 GB
+# pero `ls -lh` redondea a unidades binarias)
+ls -lh darkforensic-7b-v2-q4_k_m.gguf
+```
+<details>
+<summary>Alternativa: `wget` o `curl` (si no puedes instalar `pip`)</summary>
+```bash
+mkdir darkforensic && cd darkforensic
+# wget — usa el flag ?download=true para evitar el redirect de HF que
+# rompe descargas silenciosas con curl. -c permite reanudar si se corta.
+wget -c -O darkforensic-7b-v2-q4_k_m.gguf \
+  "https://huggingface.co/neuralghost/darkforensic-7b/resolve/main/darkforensic-7b-v2-q4_k_m.gguf?download=true"
+wget -O Modelfile \
+  "https://huggingface.co/neuralghost/darkforensic-7b/raw/main/Modelfile"
+# Verifica que el GGUF NO está vacío:
+ls -lh darkforensic-7b-v2-q4_k_m.gguf   # debe imprimir 4.4G
 ```
+`curl -L -o ...` también funciona en la mayoría de equipos, pero hemos
+visto casos (VMs Kali con NAT inestable, máquinas con TLS antiguo) en
+los que curl crea el archivo destino, sigue un redirect 302 al CDN de
+HF y luego falla silenciosamente sin reportar error. Resultado:
+archivo de 0 bytes y `Error: EOF` al hacer `ollama create`. Si te
+pasa, usa `wget -c` o `huggingface-cli` y se resuelve.
+</details>
 **3. Importa el modelo a Ollama**:
 | Síntoma | Causa probable | Solución |
 |---|---|---|
+| **`ollama create` → `Error: EOF`** o `parsing GGUF` falla | **El GGUF está vacío o incompleto.** Comprueba con `ls -lh darkforensic-7b-v2-q4_k_m.gguf`: si imprime `0` o un número menor a `4.4G`, la descarga falló silenciosamente (típico en VMs con NAT inestable cuando se usa `curl`). | Re-descargar con `huggingface-cli download …` (gestiona redirects + resume + checksum). Ver paso 2 de la instalación. Si solo tienes `wget`/`curl`, usa el sufijo `?download=true` en la URL y `wget -c` para reanudar. |
+| `ollama create` se queda colgado en `gathering model components` | El Modelfile referencia un GGUF que no existe en esa carpeta | Verifica que `darkforensic-7b-v2-q4_k_m.gguf` está en el mismo directorio que el `Modelfile`: `ls` debe mostrar ambos |
 | `Error: out of memory` al usarlo | Estás cargando fp16/bf16 en GPU pequeña, o varios modelos a la vez en Ollama | Usa Q4_K_M; `ollama stop` los otros modelos; o reduce `num_ctx` en el Modelfile (8192 → 4096) |
 | Respuestas muy lentas (< 2 tok/s) | Corriendo en CPU sin AVX2, o el modelo no cabe en RAM y está paginando a disco | Verifica `grep avx2 /proc/cpuinfo`; baja a 4 hilos con `OLLAMA_NUM_PARALLEL=1`; cierra otras apps con memoria pesada |
 | Responde en inglés cuando le hablas en castellano | Faltó el system prompt o el primer mensaje es muy corto | Asegúrate de pasar el system del Modelfile (Ollama lo aplica automáticamente con `ollama run`); con la API REST mándalo explícito |
 | "Permission denied" al ejecutar | Falta permisos en `~/.ollama` | `chmod -R u+rw ~/.ollama` |
 | El modelo alucina IOCs específicos (BTC addresses, hashes) | El modelo describe IOCs, NO los memoriza — por diseño | Es el comportamiento correcto, no un bug. Para IOCs verbatim necesitas el RAG sobre tu corpus indexado, no el LLM solo |
+| Estás en una **VM** y la descarga se corta a mitad | NAT/throughput inestable + curl + archivo de 4.7 GB es un combo malo | Usa `huggingface-cli download` (con resume automático), o `wget -c` para reanudar si se corta. Aumenta la RAM de la VM a 8 GB+ y el disco a 50 GB+ para tener margen tras descargar |
 ## Integración con un pipeline RAG (recomendado para producción)