Dusit-P
/

thai-sentiment

@@ -1,12 +1,14 @@
 ---
-language:
 - th
 tags:
 - sentiment-analysis
 - thai
 - wangchanberta
 - lstm
-pipeline_tag: text-classification
 license: apache-2.0
 library_name: transformers
 datasets:
@@ -15,5 +17,83 @@ datasets:
 # Thai Sentiment (WangchanBERTa + LSTM Heads)
-โมเดลสำหรับ Sentiment Analysis ภาษาไทย โดยใช้ WangchanBERTa เป็น backbone
-และเพิ่ม LSTM/CNN-LSTM heads เพื่อปรับปรุง performance

 ---
+language:
 - th
+pipeline_tag: text-classification
 tags:
 - sentiment-analysis
 - thai
 - wangchanberta
+- bilstm
+- cnn
 - lstm
 license: apache-2.0
 library_name: transformers
 datasets:
 # Thai Sentiment (WangchanBERTa + LSTM Heads)
+โมเดลสำหรับวิเคราะห์อารมณ์ (2 คลาส: NEG/POS) ภาษาไทย โดยใช้ **WangchanBERTa** เป็น backbone และเพิ่มหัว (heads) แบบ LSTM/CNN-LSTM หลายสถาปัตยกรรมสำหรับเปรียบเทียบและใช้งานตามบริบท
+รีโปนี้บรรจุโมเดล 4 ตัว (เก็บเป็นโฟลเดอร์ย่อย):
+- `WCB/` — WangchanBERTa (ใช้ [CLS])
+- `WCB_BiLSTM/` — WangchanBERTa → BiLSTM → Pooling
+- `WCB_CNN_BiLSTM/` — WangchanBERTa → CNN → BiLSTM → Pooling
+- `WCB_4Layer_BiLSTM/` — WangchanBERTa (ถ่วงน้ำหนัก 4 เลเยอร์สุดท้าย) → BiLSTM → Pooling
+แต่ละโฟลเดอร์มี `model.safetensors` และ `config.json` (เมตาดาต้า: `id2label/label2id`, `max_length`, `pooling_after_lstm`, `base_model`)
+## สรุปผลการประเมิน (5-fold CV)
+| Model | Accuracy (%) | F1-Score (%) | AUC (%) |
+|---|---:|---:|---:|
+| WCB | **90.33 ± 0.32** | **89.92 ± 0.33** | **95.72 ± 0.22** |
+| WCB_BiLSTM | **90.93 ± 0.37** | **90.54 ± 0.39** | **95.57 ± 1.22** |
+| WCB_CNN_BiLSTM | **90.14 ± 0.66** | **89.73 ± 0.68** | **95.83 ± 0.42** |
+| WCB_4Layer_BiLSTM | **90.52 ± 0.65** | **90.13 ± 0.68** | **95.43 ± 0.36** |
+**ข้อสังเกตย่อ**
+- **แม่นยำสูงสุด**: `WCB_BiLSTM` (Acc/F1 สูงสุด) แต่ AUC แปรปรวนกว่าตัวอื่นเล็กน้อย (±1.22%).
+- **AUC สูงสุด/เสถียรดี**: `WCB_CNN_BiLSTM` (AUC 95.83% ±0.42) เหมาะหากให้ความสำคัญกับการแยกคลาสจากสกอร์ความเชื่อมั่น แต่ Acc/F1 ต่ำกว่าเล็กน้อย.
+- **เร็ว/เสถียร**: `WCB` เร็วที่สุดและเสถียรสุด เหมาะงานทรัพยากรจำกัด.
+### เวลาเทรน (โดยเฉลี่ย)
+| Model | วินาที/รอบ | เวลารวม (ชม.) |
+|---|---:|---:|
+| WCB | 54.67 | 4.58 |
+| WCB_BiLSTM | 67.84 | 5.68 |
+| WCB_CNN_BiLSTM | 68.72 | 5.76 |
+| WCB_4Layer_BiLSTM | 72.91 | 6.11 |
+## โครงสร้างรีโป
+```
+.
+├─ WCB/
+├─ WCB_BiLSTM/
+├─ WCB_CNN_BiLSTM/
+├─ WCB_4Layer_BiLSTM/
+├─ common/
+│  ├─ models.py
+│  └─ __init__.py
+├─ requirements.txt
+├─ LICENSE
+└─ README.md
+```
+## วิธีใช้งาน
+```python
+import torch
+from common.models import load_model
+MODEL_DIR = "WCB_BiLSTM"
+tokenizer, model, cfg = load_model(MODEL_DIR)
+text = "มือถือรุ่นนี้ดีมาก ราคาคุ้มค่า"
+enc = tokenizer(text, truncation=True, padding=True,
+                return_tensors="pt", max_length=cfg.get("max_length", 128))
+with torch.no_grad():
+    logits = model(enc["input_ids"], enc["attention_mask"])
+    probs = torch.softmax(logits, dim=1)[0].tolist()
+    pred_id = int(torch.argmax(logits, dim=1))
+id2label = {int(k): v for k, v in cfg["id2label"].items()}
+print("label:", id2label[pred_id], "probs:", probs)
+```
+## เลือกโมเดลให้เหมาะงาน
+- **ต้องการความแม่นยำสูงสุด** → `WCB_BiLSTM`
+- **ทรัพยากรจำกัด/ต้องการความเร็ว** → `WCB`
+- **โฟกัส AUC/การจัดอันดับความเสี่ยง** → `WCB_CNN_BiLSTM`
+- **สมดุลโดยรวม** → `WCB_4Layer_BiLSTM`
+## License
+Apache-2.0