vanhai123 commited on
Commit
1be6034
·
verified ·
1 Parent(s): 5c211c8

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +88 -87
README.md CHANGED
@@ -1,87 +1,88 @@
1
- ---
2
- title: Vietnamese News Topic Classifier
3
- emoji: 📰
4
- colorFrom: indigo
5
- colorTo: pink
6
- sdk: gradio
7
- app_file: app.py
8
- license: other
9
- tags:
10
- - text-classification
11
- - vietnamese
12
- - news
13
- - logistic-regression
14
- - scikit-learn
15
- - tf-idf
16
- - gradio
17
- model:
18
- - vanhai123/Vietnamese-news-classifier-model
19
- ---
20
-
21
- # 📰 Vietnamese News Topic Classifier
22
-
23
- 🔎 Dự đoán chủ đề của đoạn tin tức tiếng Việt bằng mô hình **Logistic Regression + TF-IDF**.
24
- Ứng dụng này được huấn luyện trên dữ liệu tiêu đề tin tức thuộc 5 chủ đề:
25
-
26
- - 📘 **Giáo dục**
27
- - **Thể thao**
28
- - 🎬 **Giải trí**
29
- - 💻 **Công nghệ**
30
- - 🏛️ **Chính trị**
31
-
32
- ---
33
-
34
- ## 🛠 Mô hình
35
-
36
- - ✅ Logistic Regression (scikit-learn)
37
- - ✅ TF-IDF Vectorizer
38
- - ✅ Train bằng Python (sklearn), lưu bằng joblib
39
- - ✅ hình được lưu trữ tại: [vanhai123/Vietnamese-news-classifier-model](https://huggingface.co/vanhai123/Vietnamese-news-classifier-model)
40
-
41
- ---
42
-
43
- ## 🚀 Cách hoạt động
44
-
45
- 1. Người dùng nhập đoạn văn bản tiếng Việt (ví dụ: tiêu đề bài báo)
46
- 2. Văn bản được tiền xử (`lowercase`)
47
- 3. Vector hóa bằng TF-IDF
48
- 4. Dự đoán nhãn bằng Logistic Regression
49
- 5. Trả về tên chủ đề phù hợp
50
-
51
- ---
52
-
53
- ## 📦 Công nghệ sử dụng
54
-
55
- - `gradio` cho giao diện demo
56
- - `scikit-learn` cho hình học máy
57
- - `huggingface_hub` để tải mô hình từ repo
58
-
59
- ---
60
-
61
- ## 📚 Cách huấn luyện mô hình (tham khảo)
62
-
63
- Bạn có thể xem mã nguồn huấn luyện tại GitHub repo:
64
- 👉 [https://github.com/vanhai123/gginhir-news-classifier](https://github.com/vanhai123/gginhir-news-classifier)
65
-
66
- ---
67
-
68
- ## ✨ Demo
69
-
70
- Hãy thử nhập:
71
- - `"Học sinh được miễn học phí từ năm học mới"`
72
- - `"Apple ra mắt mẫu MacBook mới dùng chip AI"`
73
- - `"Đội tuyển Việt Nam chiến thắng thuyết phục"`
74
-
75
- ---
76
-
77
- ## 👤 Tác giả
78
-
79
- **vanhai123**
80
- - Hugging Face: [https://huggingface.co/vanhai123](https://huggingface.co/vanhai123)
81
- - GitHub: [https://github.com/vanhai1231](https://github.com/vanhai1231)
82
-
83
- ---
84
-
85
- ## 📄 Giấy phép
86
-
87
- Chỉ sử dụng cho mục đích học tập và nghiên cứu.
 
 
1
+ ---
2
+ title: Vietnamese News Topic Classifier
3
+ emoji: 📰
4
+ colorFrom: indigo
5
+ colorTo: pink
6
+ sdk: gradio
7
+ app_file: app.py
8
+ license: other
9
+ tags:
10
+ - text-classification
11
+ - vietnamese
12
+ - news
13
+ - logistic-regression
14
+ - scikit-learn
15
+ - tf-idf
16
+ - gradio
17
+ model:
18
+ - vanhai123/Vietnamese-news-classifier-model
19
+ sdk_version: 5.32.1
20
+ ---
21
+
22
+ # 📰 Vietnamese News Topic Classifier
23
+
24
+ 🔎 Dự đoán chủ đề của đoạn tin tức tiếng Việt bằng hình **Logistic Regression + TF-IDF**.
25
+ Ứng dụng này được huấn luyện trên dữ liệu tiêu đề tin tức thuộc 5 chủ đề:
26
+
27
+ - 📘 **Giáo dục**
28
+ - **Thể thao**
29
+ - 🎬 **Giải trí**
30
+ - 💻 **Công nghệ**
31
+ - 🏛️ **Chính trị**
32
+
33
+ ---
34
+
35
+ ## 🛠 Mô hình
36
+
37
+ - ✅ Logistic Regression (scikit-learn)
38
+ - ✅ TF-IDF Vectorizer
39
+ - ✅ Train bằng Python (sklearn), lưu bằng joblib
40
+ - ✅ Mô hình được lưu trữ tại: [vanhai123/Vietnamese-news-classifier-model](https://huggingface.co/vanhai123/Vietnamese-news-classifier-model)
41
+
42
+ ---
43
+
44
+ ## 🚀 Cách hoạt động
45
+
46
+ 1. Người dùng nhập đoạn văn bản tiếng Việt (ví dụ: tiêu đề bài báo)
47
+ 2. Văn bản được tiền xử lý (`lowercase`)
48
+ 3. Vector hóa bằng TF-IDF
49
+ 4. Dự đoán nhãn bằng Logistic Regression
50
+ 5. Trả về tên chủ đề phù hợp
51
+
52
+ ---
53
+
54
+ ## 📦 Công nghệ sử dụng
55
+
56
+ - `gradio` cho giao diện demo
57
+ - `scikit-learn` cho mô hình học máy
58
+ - `huggingface_hub` để tải mô hình từ repo
59
+
60
+ ---
61
+
62
+ ## 📚 Cách huấn luyện mô hình (tham khảo)
63
+
64
+ Bạn có thể xem mã nguồn huấn luyện tại GitHub repo:
65
+ 👉 [https://github.com/vanhai123/gginhir-news-classifier](https://github.com/vanhai123/gginhir-news-classifier)
66
+
67
+ ---
68
+
69
+ ## ✨ Demo
70
+
71
+ Hãy thử nhập:
72
+ - `"Học sinh được miễn học phí từ năm học mới"`
73
+ - `"Apple ra mắt mẫu MacBook mới dùng chip AI"`
74
+ - `"Đội tuyển Việt Nam chiến thắng thuyết phục"`
75
+
76
+ ---
77
+
78
+ ## 👤 Tác giả
79
+
80
+ **vanhai123**
81
+ - Hugging Face: [https://huggingface.co/vanhai123](https://huggingface.co/vanhai123)
82
+ - GitHub: [https://github.com/vanhai1231](https://github.com/vanhai1231)
83
+
84
+ ---
85
+
86
+ ## 📄 Giấy phép
87
+
88
+ Chỉ sử dụng cho mục đích học tập và nghiên cứu.