argo11/app-classification-lgbm-141apps

概要

argo11/app-classification-data141apps_processed.parquet を入力として学習した LightGBM multiclass classifier です。ネットワーク flow 統計から application protocol / service を分類します。

確認した内容

  • 主なファイル: lgbm_model.txt, lgbm_model_meta.json
  • 入力: data/processed/141apps_processed.parquet
  • target: target
  • feature 数: 56
  • 学習サンプル: 49,999 行の sampled training
  • class 数: 65
  • dropped class: MQTT
  • validation accuracy: 0.8838
  • validation macro F1: 0.6989
  • smoke run も smoke/ に保存されています。

推定した内容

  • full dataset 全体ではなく、50,000 行 sample で短時間学習した baseline model と推定しています。

用途

  • 141-app network flow classification の LightGBM baseline
  • FT-Transformer 系 model との比較
  • feature importance / tabular baseline 検証

制限

  • class imbalance と rare class filtering の影響があります。
  • metadata に記録された preprocessing と同じ feature order で推論してください。

関連 dataset

  • argo11/app-classification-data
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support