Upload folder using huggingface_hub

Files changed (3) hide show

README.md ADDED Viewed

+# TextCNN Essay Scorer
+Лёгкая CNN-модель для автоматической оценки эссе.
+## Архитектура
+- Embedding dim: 128
+- Filters: 128 × [2, 3, 4, 5]
+- Tokenizer: `bert-base-uncased`
+## Загрузка
+```python
+import json
+import torch
+from huggingface_hub import snapshot_download
+from modeling_textcnn import TextCNNRegressor
+# Скачиваем репо
+path = snapshot_download(repo_id="rezka00/textcnn-essay-model")
+# Читаем конфиг
+with open(f"{path}/textcnn_config.json") as f:
+    cfg = json.load(f)
+# Восстанавливаем модель
+model = TextCNNRegressor(
+    vocab_size=cfg["vocab_size"],
+    embed_dim=cfg["embed_dim"],
+    num_filters=cfg["num_filters"],
+    filter_sizes=cfg["filter_sizes"],
+    dropout=cfg["dropout"],
+)
+# Загружаем веса
+from safetensors.torch import load_file
+state_dict = load_file(f"{path}/model.safetensors")
+model.load_state_dict(state_dict)
+model.eval()
+```

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6bcb9997b80aa2f133c829a5ec77368341acb43a2add4e5e7a63c52f0f37f38e
+size 16549780

textcnn_config.json ADDED Viewed

+{
+    "vocab_size": 30522,
+    "embed_dim": 128,
+    "num_filters": 128,
+    "filter_sizes": [
+        2,
+        3,
+        4,
+        5
+    ],
+    "dropout": 0.3,
+    "tokenizer_name": "bert-base-uncased",
+    "max_length": 1024
+}