LilithHu's picture
Update README.md
2cbe0f1 verified
metadata
license: other
datasets:
  - thu-coai/cdconv
language:
  - en
  - zh
metrics:
  - accuracy
  - precision
  - recall
  - f1
base_model:
  - google-bert/bert-base-multilingual-cased
pipeline_tag: text-classification
library_name: transformers
tags:
  - manipulative-language
  - social-psychology

Model Card for mBERT Manipulative Language Detector

本模型用于检测中文和英文文本中的操纵性语言(Manipulative Language),例如隐性控制、情感勒索、语言操控等,广泛应用于社交心理、文本筛查和内容审核等场景。

🧠 Model Details

  • Developed by: LilithHu
  • Finetuned from: google-bert/bert-base-multilingual-cased
  • Languages: 中文、英文
  • License: other
  • Model type: 文本分类模型(binary classifier: manipulative / non-manipulative)

🔧 Uses

✅ Direct Use

  • 输入一段文本,模型将返回该文本是否包含操纵性语言。
  • 可通过 Hugging Face Inference API 或 Web UI(Streamlit)直接调用。

👥 Intended Users

  • NLP 研究者
  • 内容审核从业者
  • 心理学研究人员
  • 社交平台或对话系统开发者

🚫 Out-of-Scope Use

  • 本模型不适合用于:

    • 法律审判
    • 医疗诊断
    • 精准营销等高风险商业行为
    • 判定他人动机、人格或情感

⚠️ Bias, Risks and Limitations

请注意:

  • 模型输出不等于事实,仅基于训练数据的模式进行分类
  • 操纵性语言的判断带有一定主观性与文化偏差
  • 不应被用于评判具体个人、情感或行为正当性

✅ 建议

使用者应结合人工判断,多模态、多渠道地理解文本含义。对于模型预测结果不可盲信,应视为辅助工具。

🚀 How to Use

from transformers import pipeline
classifier = pipeline("text-classification", model="LilithHu/mbert-manipulative-detector")
result = classifier("我爱你")
print(result)

也可通过终端调用:

curl -X POST https://api-inference.huggingface.co/models/LilithHu/mbert-manipulative-detector \
  -H "Authorization: Bearer <your_hf_token>" \
  -H "Content-Type: application/json" \
  -d '{"inputs": "我爱你"}'

🏋️ Training Details

📚 Training Data

  • CDial-GPT/toy_valid
  • thu-coai/esconv、cdconv 数据集
  • 自建中文操纵性语言语料(未公开)

⚙️ Training Procedure

  • 训练平台:Google Colab,GPU:T4
  • Epochs: 3
  • Batch size: 32
  • Optimizer: AdamW
  • LR: 2e-5

📊 Evaluation

Metric Score
Accuracy 0.**
Precision 0.**
Recall 0.**
F1-score 0.**

🌍 Environmental Impact

  • 训练时间约 3 小时,使用 Google Colab GPU(T4)
  • 估算碳排放 < 2kg CO2eq

🔒 Disclaimer

  • 本模型用于研究与教育用途,不得作为法律、道德、医疗或商业判断依据。
  • 预测结果仅为参考,使用者需自行承担风险。
  • 请勿用于恶意攻击、舆情操纵或误导他人行为。

📌 Model Card Authors

LilithHu

📬 Contact

如需反馈建议,请通过 Hugging Face 留言联系作者。

📚 Citation

@misc{LilithHu2025,
  title={mBERT Manipulative Language Detector},
  author={LilithHu},
  year={2025},
  url={https://huggingface.co/LilithHu/mbert-manipulative-detector}
}