Allanatrix
/

Summary_model

Text Classification

article-extraction

Model card Files Files and versions

Allanatrix commited on 29 days ago

Commit

391ec69

·

verified ·

1 Parent(s): 70cfc92

Update README.md

Files changed (1) hide show

README.md +0 -6

README.md CHANGED Viewed

@@ -24,12 +24,6 @@ A fast, lightweight classifier that categorizes web article extraction outcomes
 This model predicts whether HTML extraction succeeded, failed, or returned a non-article page. It combines rule-based heuristics for speed with XGBoost for accuracy on ambiguous cases.
-**Key Features:**
-- Processes only first 64KB of HTML for speed
-- 99.99% accuracy on test set
-- Rule-based fast path handles 80%+ of cases instantly
-- Only 26 hand-crafted features (no large embeddings)
 ## Classes
 | Class | Description |

 This model predicts whether HTML extraction succeeded, failed, or returned a non-article page. It combines rule-based heuristics for speed with XGBoost for accuracy on ambiguous cases.
 ## Classes
 | Class | Description |