od-dev
/

qwen3.5-35b-a3b-mod-sparse-merged

Text Generation

Model card Files Files and versions

Qwen3.5-35B-A3B Moderation — Sparse (BF16)

Merged LoRA fine-tune of Qwen/Qwen3.5-35B-A3B for chat content moderation (sparse output format).

Base model: Qwen/Qwen3.5-35B-A3B
Format: BF16
Task: 5-category chat moderation (underage, bestiality, selfHarm, sexualViolenceGore, realTerrorism)
Output: Sparse JSON — {} for safe, {"underage": "evidence"} for flagged
Serving: vLLM with --tensor-parallel-size 1 on 1xH200 or --tensor-parallel-size 2 on 2xH100, requires CUDA 12.6+

Downloads last month: 1

Safetensors

Model size

36B params

Tensor type

BF16

·

F32

·

Model tree for od-dev/qwen3.5-35b-a3b-mod-sparse-merged

Base model

Qwen/Qwen3.5-35B-A3B-Base

Finetuned

Qwen/Qwen3.5-35B-A3B

Finetuned

(130)

this model