sainikhiljuluri
/

DeepSeek-R1-Cybersecurity-8B-Merged

Text Generation

text-generation-inference

Model card Files Files and versions

sainikhiljuluri commited on Dec 5, 2025

Commit

518ff09

·

verified ·

1 Parent(s): de30706

Update README with inference config

Files changed (1) hide show

README.md +22 -18

README.md CHANGED Viewed

@@ -14,6 +14,7 @@ datasets:
 language:
 - en
 pipeline_tag: text-generation
 inference: true
 ---
@@ -40,44 +41,47 @@ This merged model can be loaded directly without needing PEFT.
 ## Usage
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-# Load merged model directly (no PEFT needed!)
 model = AutoModelForCausalLM.from_pretrained(
     "sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged",
     torch_dtype=torch.bfloat16,
-    device_map="auto"
 )
-tokenizer = AutoTokenizer.from_pretrained("sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged")
-# Generate
-prompt = "Explain how to detect SQL injection attacks in web server logs."
 inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
 outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
-## Inference API
-This model is deployed on HuggingFace Inference Endpoints.
 ```python
-from huggingface_hub import InferenceClient
-client = InferenceClient("sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged")
-response = client.text_generation(
-    "What are the indicators of a ransomware attack?",
-    max_new_tokens=256
-)
-print(response)
 ```
-## Cybersecurity Tasks
 - 🔍 Threat analysis and classification
-- 🚨 Security alert triage
 - 📋 Incident response guidance
 - 🦠 Malware analysis
 - 📊 MITRE ATT&CK mapping

 language:
 - en
 pipeline_tag: text-generation
+library_name: transformers
 inference: true
 ---
 ## Usage
+### Direct Loading
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 model = AutoModelForCausalLM.from_pretrained(
     "sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged",
     torch_dtype=torch.bfloat16,
+    device_map="auto",
+    trust_remote_code=True
+)
+tokenizer = AutoTokenizer.from_pretrained(
+    "sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged",
+    trust_remote_code=True
 )
+prompt = "Explain how to detect SQL injection attacks."
 inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
 outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
+### Via Inference API
 ```python
+import requests
+API_URL = "https://api-inference.huggingface.co/models/sainikhiljuluri/DeepSeek-R1-Cybersecurity-8B-Merged"
+headers = {"Authorization": "Bearer YOUR_HF_TOKEN"}
+response = requests.post(API_URL, headers=headers, json={
+    "inputs": "What are the indicators of a ransomware attack?",
+    "parameters": {"max_new_tokens": 256, "temperature": 0.7}
+})
+print(response.json())
 ```
+## Cybersecurity Capabilities
 - 🔍 Threat analysis and classification
+- 🚨 Security alert triage
 - 📋 Incident response guidance
 - 🦠 Malware analysis
 - 📊 MITRE ATT&CK mapping
+- 🔐 Vulnerability assessment