| | --- |
| | license: mit |
| | widget: |
| | |
| | - text: 从北京到莫斯科 |
| | example_title: 从北京到莫斯科 |
| | - text: 色卡里的春天 |
| | example_title: 色卡里的春天 |
| | - text: 中俄联合声明 释放了几个信号 |
| | example_title: 中俄联合声明 释放了几个信号 |
| | - text: 鸡鸣寺游客爆满设反悔门引导离寺 |
| | example_title: 鸡鸣寺游客爆满设反悔门引导离寺 |
| | datasets: |
| | - fourteenBDr/toutiao |
| | language: |
| | - zh |
| | pipeline_tag: text-classification |
| | --- |
| | |
| | # 中文新闻分类模型 |
| |
|
| | ## 介绍 |
| |
|
| | 基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py) |
| |
|
| | ## 使用 |
| |
|
| | ```python |
| | from transformers import pipeline |
| | classifier = pipeline("text-classification", model="myml/toutiao") |
| | classifier("只要关羽不捣乱,峡谷4V5也不怕?") |
| | # echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}] |
| | ``` |
| |
|
| | ## 结果映射 |
| |
|
| | ```txt |
| | LABEL_0 民生 故事 |
| | LABEL_1 文化 文化 |
| | LABEL_2 娱乐 娱乐 |
| | LABEL_3 体育 体育 |
| | LABEL_4 财经 财经 |
| | LABEL_6 房产 房产 |
| | LABEL_7 汽车 汽车 |
| | LABEL_8 教育 教育 |
| | LABEL_9 科技 科技 |
| | LABEL_10 军事 军事 |
| | LABEL_12 旅游 旅游 |
| | LABEL_13 国际 国际 |
| | LABEL_14 证券 股票 |
| | LABEL_15 农业 三农 |
| | LABEL_16 电竞 游戏 |
| | ``` |