Spaces:

abcd1234davidchen
/

PolStance

Sleeping

App Files Files Community

abcd1234davidchen commited on Dec 4, 2025

Commit

9ee1e28

1 Parent(s): 4296e9b

Upload 3 files

Browse files

Files changed (3) hide show

app.py +9 -34
model.py +82 -0
stance_classifier.pth +3 -0

app.py CHANGED Viewed

@@ -1,39 +1,13 @@
 import torch
 import torch.nn as nn
-from transformers import AutoTokenizer, AutoModel
 import gradio as gr
 import re
-class StanceClassifier(nn.Module):
-    def __init__(self,transformer_model, num_classes, dropout_rate=0.6):
-        super(StanceClassifier, self).__init__()
-        self.transformer = transformer_model
-        self.dropout = nn.Dropout(dropout_rate)
-        self.layer_norm = nn.LayerNorm(transformer_model.config.hidden_size)
-        l0 = transformer_model.config.hidden_size
-        l1 = l0 // 2
-        l2 = l1 // 2
-        self.classifier = nn.Sequential(
-            nn.Linear(l0, l1),
-            nn.LayerNorm(l1),
-            nn.GELU(),
-            nn.Dropout(dropout_rate),
-            nn.Linear(l1, l2),
-            nn.LayerNorm(l2),
-            nn.GELU(),
-            nn.Dropout(dropout_rate),
-            nn.Linear(l2, num_classes),
-        )
-    def forward(self, input_ids, attention_mask):
-        outputs = self.transformer(input_ids=input_ids, attention_mask=attention_mask)
-        pooled_output = outputs.last_hidden_state[:, 0]
-        pooled_output = self.layer_norm(pooled_output)
-        logits = self.classifier(pooled_output)
-        return logits
 torch.manual_seed(42)
-checkpoint = "hfl/chinese-roberta-wwm-ext"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 base_model = AutoModel.from_pretrained(checkpoint)
 model = StanceClassifier(base_model, num_classes=3)
@@ -42,7 +16,7 @@ model.eval()
 labels = ['KMT', 'DPP', 'Neutral']
 def predict_stance(text):
-    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=64)
     with torch.no_grad():
         outputs = model(
             input_ids=inputs["input_ids"],
@@ -56,10 +30,11 @@ def predict_stance(text):
 def gradio_interface(text):
     sentences = re.split(r"[。！？\n]", text)
-    sentences = [s for s in sentences if s.strip()]
     results = []
-    for s in sentences:
-        stance, conf = predict_stance(s)
         results.append((s + f" (Confidence: {conf:.4f})", stance))
     return results

 import torch
 import torch.nn as nn
+from transformers import AutoModel, BertTokenizerFast
 import gradio as gr
 import re
+from model import StanceClassifier
 torch.manual_seed(42)
+checkpoint = "ckiplab/bert-base-chinese"
+tokenizer = BertTokenizerFast.from_pretrained('bert-base-chinese')
 base_model = AutoModel.from_pretrained(checkpoint)
 model = StanceClassifier(base_model, num_classes=3)
 labels = ['KMT', 'DPP', 'Neutral']
 def predict_stance(text):
+    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=512)
     with torch.no_grad():
         outputs = model(
             input_ids=inputs["input_ids"],
 def gradio_interface(text):
     sentences = re.split(r"[。！？\n]", text)
+    sentences = [s for idx, s in enumerate(sentences) if s.strip()]
+    accumulate_sentence = [" ".join(sentences[:idx+1]) for idx, s in enumerate(sentences) if s.strip()]
     results = []
+    for s, acus in zip(sentences, accumulate_sentence):
+        stance, conf = predict_stance(acus)
         results.append((s + f" (Confidence: {conf:.4f})", stance))
     return results

model.py ADDED Viewed

	@@ -0,0 +1,82 @@

+import torch
+import torch.nn as nn
+class StanceClassifier(nn.Module):
+    def __init__(self, transformer_model, num_classes, dropout_rate=0.6):
+        super(StanceClassifier, self).__init__()
+        self.transformer = transformer_model
+        self.dropout = nn.Dropout(dropout_rate)
+        self.layer_norm = nn.LayerNorm(transformer_model.config.hidden_size)
+        l0 = transformer_model.config.hidden_size
+        l1 = transformer_model.config.hidden_size * 2
+        l2 = l1 // 2
+        l3 = l2 // 2
+        # classifier expects pooled token representation (batch, hidden)
+        self.classifier = nn.Sequential(
+            nn.Linear(l0, l1),
+            nn.LayerNorm(l1),
+            nn.GELU(),
+            nn.Dropout(dropout_rate),
+            nn.Linear(l1, l2),
+            nn.LayerNorm(l2),
+            nn.GELU(),
+            nn.Dropout(dropout_rate),
+            nn.Linear(l2, l3),
+            nn.LayerNorm(l3),
+            nn.GELU(),
+            nn.Linear(l3, num_classes),
+        )
+        self.attention_vector = nn.Linear(l0, 1)
+        nn.init.xavier_uniform_(self.attention_vector.weight)
+        self.freeze_transformer()
+    def freeze_transformer(self):
+        for param in self.transformer.parameters():
+            param.requires_grad = False
+    def unfreeze_transformer(self):
+        for param in self.transformer.parameters():
+            param.requires_grad = True
+    def forward(self, input_ids, attention_mask):
+        if not any(p.requires_grad for p in self.transformer.parameters()):
+            with torch.no_grad():
+                outputs = self.transformer(
+                    input_ids=input_ids, attention_mask=attention_mask
+                )
+        else:
+            outputs = self.transformer(
+                input_ids=input_ids, attention_mask=attention_mask
+            )
+        # token-level hidden states: (batch, seq_len, hidden)
+        token_states = outputs.last_hidden_state
+        scores = self.attention_vector(token_states).squeeze(-1)  # (batch, seq_len)
+        mask = attention_mask.to(dtype=torch.bool)  # (batch, seq_len)
+        scores = scores.masked_fill(~mask, -1e9)
+        weights = torch.softmax(scores, dim=1)  # (batch, seq_len)
+        pooled_output = (weights.unsqueeze(-1) * token_states).sum(dim=1)  # (batch, hidden)
+        if torch.isnan(pooled_output).any() or torch.isinf(pooled_output).any():
+            print("WARNING: Transformer output NaN/Inf")
+            pooled_output = torch.where(
+                torch.isnan(pooled_output) | torch.isinf(pooled_output),
+                torch.zeros_like(pooled_output),
+                pooled_output,
+            )
+        pooled_output = self.layer_norm(pooled_output)
+        logits = self.classifier(pooled_output)
+        return logits
+    def classifier_params(self):
+        return list(self.classifier.parameters())
+    def transformer_params(self):
+        return list(self.transformer.parameters())

stance_classifier.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0674d3874bfd18e814d48820cffc501d586178802fbf7d044a96f6dcc0241b3d
+size 419826179