argo11/app-classification-lgbm-87apps
概要
argo11/app-classification-data の 87apps_processed.parquet を入力として学習した LightGBM multiclass classifier の smoke / baseline checkpoint です。Unicauca 87 attributes 系の network flow から application protocol を分類します。
確認した内容
- 主なファイル:
smoke/lgbm_model.txt,smoke/lgbm_model_meta.json - 入力:
data/processed/87apps_processed.parquet - target:
target - sample rows: 2,000
- feature は
Source.Port,Destination.Port,Protocol,Flow.Duration, packet / IAT / flag 統計、派生特徴量を含みます。 - dropped classes:
125,64,68
推定した内容
- repo には smoke checkpoint のみがあり、本格学習版ではなく動作確認・baseline 用 model と推定しています。
用途
- 87-app network flow classification の LightGBM smoke test
- preprocessing pipeline と feature order の確認
制限
- 2,000 行 sample の smoke run なので、性能評価用の最終 model としては扱わないでください。
- metadata と同じ preprocessing、label mapping、feature order が必要です。
関連 dataset
argo11/app-classification-data