Amensiax commited on
Commit
2b0696a
·
verified ·
1 Parent(s): bbff1ad

Upload folder using huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +73 -0
README.md ADDED
@@ -0,0 +1,73 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ language:
4
+ - zh
5
+ tags:
6
+ - text-classification
7
+ - safety
8
+ - qwen
9
+ - 14b
10
+ - security
11
+ pipeline_tag: text-classification
12
+ ---
13
+
14
+ # TextSafeGuard
15
+
16
+ ## 模型介绍
17
+
18
+ TextSafeGuard 是一个基于 Qwen3-14B-Instruct 微调的**文本安全检测模型**,专门用于识别和分类文本中的安全风险。
19
+
20
+ ## 核心功能
21
+
22
+ - ✅ **风险检测**:判断输入文本是否存在安全风险
23
+ - ✅ **风险分类**:对检测到的风险进行精细分类
24
+ - ✅ **多场景支持**:覆盖多种风险场景
25
+ - ✅ **高精度**:基于大语言模型的强理解能力
26
+
27
+ ## 支持的风险类别
28
+
29
+ - 犯罪与违法活动 (Crimes_And_Illegal_Activities)
30
+ - 不公平与歧视 (Unfairness_And_Discrimination)
31
+ - 侮辱与攻击 (Insult)
32
+ - 心理健康 (Mental_Health)
33
+ - 道德与伦理 (Ethics_And_Morality)
34
+ - 身体伤害 (Physical_Harm)
35
+ - 隐私与财产 (Privacy_And_Property)
36
+ - 危险指令 (Unsafe_Instruction_Topic)
37
+ - 目标劫持 (Goal_Hijacking)
38
+ - 提示泄露 (Prompt_Leaking)
39
+ - 无风险 (无风险)
40
+
41
+ ## 使用方法
42
+
43
+ ### Transformers(推荐)
44
+
45
+ ```python
46
+ from transformers import AutoModelForSequenceClassification, AutoTokenizer
47
+
48
+ model = AutoModelForSequenceClassification.from_pretrained("Blingsec-safe/TextSafeGuard")
49
+ tokenizer = AutoTokenizer.from_pretrained("Blingsec-safe/TextSafeGuard")
50
+
51
+ inputs = tokenizer("待检测文本", return_tensors="pt")
52
+ outputs = model(**inputs)
53
+ ```
54
+
55
+ ### Ollama
56
+
57
+ ```bash
58
+ ollama run bling-text:14b "请判断以下文本是否存在风险:你的文本"
59
+ ```
60
+
61
+ ## 模型信息
62
+
63
+ | 项目 | 详情 |
64
+ |------|------|
65
+ | 基础模型 | Qwen3-14B-Instruct |
66
+ | 训练方法 | LoRA |
67
+ | 参数量 | 14.8B |
68
+ | 量化 | Q8_0 |
69
+ | 上下文长度 | 40960 |
70
+
71
+ ## 许可证
72
+
73
+ Apache 2.0