argo11/app-classification-lgbm-141apps
概要
argo11/app-classification-data の 141apps_processed.parquet を入力として学習した LightGBM multiclass classifier です。ネットワーク flow 統計から application protocol / service を分類します。
確認した内容
- 主なファイル:
lgbm_model.txt,lgbm_model_meta.json - 入力:
data/processed/141apps_processed.parquet - target:
target - feature 数: 56
- 学習サンプル: 49,999 行の sampled training
- class 数: 65
- dropped class:
MQTT - validation accuracy: 0.8838
- validation macro F1: 0.6989
- smoke run も
smoke/に保存されています。
推定した内容
- full dataset 全体ではなく、50,000 行 sample で短時間学習した baseline model と推定しています。
用途
- 141-app network flow classification の LightGBM baseline
- FT-Transformer 系 model との比較
- feature importance / tabular baseline 検証
制限
- class imbalance と rare class filtering の影響があります。
- metadata に記録された preprocessing と同じ feature order で推論してください。
関連 dataset
argo11/app-classification-data