Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

best_metadata.json +10 -0
best_model.safetensors +3 -0
inference_config.json +11 -0
label_map.json +89 -0
model_config.json +38 -0
tokenizer/tokenizer.json +0 -0
tokenizer/tokenizer_config.json +23 -0

best_metadata.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "run_dir": "/Users/baseconnect/hawks_utils/reducer-data-agent/pipeline-output/training_runs/20260306_001508",
+  "promoted_at": "2026-03-06T08:03:00",
+  "primary_metric": "macro_f1",
+  "accuracy": 0.8684807256235828,
+  "macro_f1": 0.833427366079523,
+  "weighted_f1": 0.8698534999896407,
+  "best_epoch": 15,
+  "test_file": "/Users/baseconnect/hawks_utils/reducer-data-agent/test-data/Hawks_ver6.0_alternative.csv"
+}

best_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:256d79ef28da90dc5f300dc5b569c3e1d855b21c4b67e17e8ff5c94c868a1138
+size 639688828

inference_config.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "max_length": 512,
+  "title_empty_token": "[TITLE_EMPTY]",
+  "title_repeat": true,
+  "url_token": "[URL]",
+  "pooling": "cls",
+  "pick_map": {
+    "Decline": 0,
+    "Pick": 1
+  }
+}

label_map.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+  "CSR活動": 0,
+  "DX": 1,
+  "M&A": 2,
+  "イベント": 3,
+  "サイバー攻撃": 4,
+  "システム障害": 5,
+  "ダイバーシティ": 6,
+  "ハラスメント問題": 7,
+  "リニューアルオープン": 8,
+  "不法就労": 9,
+  "不適切広告": 10,
+  "不適切発言": 11,
+  "事故": 12,
+  "事業効率化": 13,
+  "事業縮小": 14,
+  "人事異動": 15,
+  "人材育成": 16,
+  "代表者死亡": 17,
+  "企業間トラブル": 18,
+  "企業間取引解消": 19,
+  "価格変更": 20,
+  "債務超過": 21,
+  "債権回収不能": 22,
+  "債権譲渡": 23,
+  "公害": 24,
+  "再建型倒産": 25,
+  "労働争議": 26,
+  "労働災害": 27,
+  "労働者の自殺・失踪": 28,
+  "反社会的勢力関与": 29,
+  "受賞": 30,
+  "品質管理不正": 31,
+  "商品表示の不備": 32,
+  "広報活動": 33,
+  "役員変更": 34,
+  "従業員の不祥事": 35,
+  "従業員数減少": 36,
+  "情報漏洩": 37,
+  "批判的投稿": 38,
+  "提携": 39,
+  "新商品の展開": 40,
+  "新工場竣工": 41,
+  "新店舗開店": 42,
+  "新施設開設": 43,
+  "新規事業参入": 44,
+  "新規採用": 45,
+  "新設備導入": 46,
+  "本社住所移転": 47,
+  "株主変更": 48,
+  "株主総会開催": 49,
+  "株式保有率変更": 50,
+  "株式公開": 51,
+  "業績悪化": 52,
+  "業績改善": 53,
+  "横領": 54,
+  "海外進出": 55,
+  "清算型倒産": 56,
+  "特許取得": 57,
+  "生産停止": 58,
+  "生産再開": 59,
+  "生産拡大": 60,
+  "異物混入": 61,
+  "知的財産権の侵害": 62,
+  "研究開発": 63,
+  "社名変更": 64,
+  "税務違反": 65,
+  "粉飾決算": 66,
+  "組織体制変更": 67,
+  "経営計画": 68,
+  "職場環境改善": 69,
+  "行政処分": 70,
+  "補助金獲得": 71,
+  "設備投資": 72,
+  "訴訟": 73,
+  "詐欺": 74,
+  "認定取得": 75,
+  "談合": 76,
+  "販路拡大": 77,
+  "賃上げ": 78,
+  "賃金未払い": 79,
+  "資本金の変更": 80,
+  "資金調達": 81,
+  "贈収賄": 82,
+  "通信障害": 83,
+  "逮捕": 84,
+  "違法残業": 85,
+  "顧客トラブル": 86
+}

model_config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "architectures": [
+    "DebertaV2ForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 96871,
+  "dtype": "float32",
+  "eos_token_id": 96868,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-07,
+  "legacy": true,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 96869,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 768,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "tie_word_embeddings": true,
+  "transformers_version": "5.1.0",
+  "type_vocab_size": 0,
+  "vocab_size": 96873
+}

tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "bos_token": "[CLS]",
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "eos_token": "[SEP]",
+  "extra_special_tokens": [
+    "[TITLE_EMPTY]"
+  ],
+  "is_local": true,
+  "keep_accents": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "sp_model_kwargs": {},
+  "split_by_punct": false,
+  "tokenizer_class": "DebertaV2Tokenizer",
+  "unk_id": 1,
+  "unk_token": "[UNK]"
+}