--- license: mit language: - es tags: - cybersecurity - seguridad-informatica - qwen2.5 - lora - sft - unsloth base_model: unsloth/qwen2.5-1.5b-bnb-4bit pipeline_tag: text-generation --- # MurdokLLmHack — Modelo de Ciberseguridad Fine-Tuned Modelo fine-tuned sobre Qwen2.5-1.5B con +16,000 pares Q&A extraídos de 59 documentos técnicos de ciberseguridad. ## Uso con Ollama (recomendado) ```bash ollama run murdokllmhack ``` ## Uso con Transformers + PEFT ```python from transformers import AutoModelForCausalLM, AutoTokenizer from peft import PeftModel import torch base = AutoModelForCausalLM.from_pretrained( 'unsloth/qwen2.5-1.5b-bnb-4bit', device_map='auto', torch_dtype=torch.float16 ) tokenizer = AutoTokenizer.from_pretrained('unsloth/qwen2.5-1.5b-bnb-4bit') model = PeftModel.from_pretrained(base, 'murdok1982/MurdokLLmHack-LoRA') prompt = '<|im_start|>system\nEres un experto en ciberseguridad.<|im_end|>\n<|im_start|>user\nQue es un firewall?<|im_end|>\n<|im_start|>assistant' inputs = tokenizer(prompt, return_tensors='pt').to('cuda') outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ``` ## Uso con GGUF (inferencia local CPU) Descarga el GGUF y usa: ```bash ollama create murdokllmhack -f Modelfile ollama run murdokllmhack ``` ## Detalles del Fine-Tuning - **Base:** Qwen2.5-1.5B - **Dataset:** 16,026 train / 1,781 validation (formato ChatML) - **Entrenamiento:** Unsloth + LoRA (r=32), 3 epochs, T4 Colab - **Cuantizacion:** Q8_0 (GGUF), fp16 (merge) - **Contexto:** 131,072 tokens ## Contacto - **Email:** gustavolobatoclara@gmail.com - **LinkedIn:** https://www.linkedin.com/in/gustavo-lobato-clara1982/ - **Dataset:** https://huggingface.co/datasets/murdok1982/formacion-seguridad-qa