Push model using huggingface_hub.
Browse files- README.md +26 -25
- config_setfit.json +2 -2
- model.safetensors +1 -1
- model_head.pkl +1 -1
README.md
CHANGED
|
@@ -10,11 +10,13 @@ tags:
|
|
| 10 |
- text-classification
|
| 11 |
- generated_from_setfit_trainer
|
| 12 |
widget:
|
| 13 |
-
- text: '
|
| 14 |
-
- text: '
|
| 15 |
-
|
| 16 |
-
- text: '
|
| 17 |
-
- text: '
|
|
|
|
|
|
|
| 18 |
inference: true
|
| 19 |
model-index:
|
| 20 |
- name: SetFit with akhooli/sbert_ar_nli_500k_norm
|
|
@@ -28,7 +30,7 @@ model-index:
|
|
| 28 |
split: test
|
| 29 |
metrics:
|
| 30 |
- type: accuracy
|
| 31 |
-
value: 0.
|
| 32 |
name: Accuracy
|
| 33 |
---
|
| 34 |
|
|
@@ -60,17 +62,17 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
| 60 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
| 61 |
|
| 62 |
### Model Labels
|
| 63 |
-
| Label | Examples
|
| 64 |
-
|:---------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 65 |
-
|
|
| 66 |
-
|
|
| 67 |
|
| 68 |
## Evaluation
|
| 69 |
|
| 70 |
### Metrics
|
| 71 |
| Label | Accuracy |
|
| 72 |
|:--------|:---------|
|
| 73 |
-
| **all** | 0.
|
| 74 |
|
| 75 |
## Uses
|
| 76 |
|
|
@@ -90,7 +92,7 @@ from setfit import SetFitModel
|
|
| 90 |
# Download from the 🤗 Hub
|
| 91 |
model = SetFitModel.from_pretrained("akhooli/setfit")
|
| 92 |
# Run inference
|
| 93 |
-
preds = model("
|
| 94 |
```
|
| 95 |
|
| 96 |
<!--
|
|
@@ -122,18 +124,18 @@ preds = model("إنه حلو ومضحك وساحر ومبهج تمامًا. ")
|
|
| 122 |
### Training Set Metrics
|
| 123 |
| Training set | Min | Median | Max |
|
| 124 |
|:-------------|:----|:-------|:----|
|
| 125 |
-
| Word count |
|
| 126 |
|
| 127 |
| Label | Training Sample Count |
|
| 128 |
|:---------|:----------------------|
|
| 129 |
-
| negative |
|
| 130 |
-
| positive |
|
| 131 |
|
| 132 |
### Training Hyperparameters
|
| 133 |
- batch_size: (32, 32)
|
| 134 |
-
- num_epochs: (
|
| 135 |
-
- max_steps:
|
| 136 |
-
- sampling_strategy:
|
| 137 |
- body_learning_rate: (2e-05, 1e-05)
|
| 138 |
- head_learning_rate: 0.01
|
| 139 |
- loss: CosineSimilarityLoss
|
|
@@ -144,17 +146,16 @@ preds = model("إنه حلو ومضحك وساحر ومبهج تمامًا. ")
|
|
| 144 |
- warmup_proportion: 0.1
|
| 145 |
- l2_weight: 0.01
|
| 146 |
- seed: 42
|
|
|
|
| 147 |
- eval_max_steps: -1
|
| 148 |
- load_best_model_at_end: False
|
| 149 |
|
| 150 |
### Training Results
|
| 151 |
-
| Epoch
|
| 152 |
-
|:-----
|
| 153 |
-
| 0.
|
| 154 |
-
|
|
| 155 |
-
|
|
| 156 |
-
| 7.1429 | 150 | 0.0003 | - |
|
| 157 |
-
| 9.5238 | 200 | 0.0003 | - |
|
| 158 |
|
| 159 |
### Framework Versions
|
| 160 |
- Python: 3.10.14
|
|
|
|
| 10 |
- text-classification
|
| 11 |
- generated_from_setfit_trainer
|
| 12 |
widget:
|
| 13 |
+
- text: 'إن التعامل الدقيق مع شركة labute يجعل المادة تبدو أصلية وليست قوادة. '
|
| 14 |
+
- text: 'كوبا جودينج جونيور يشق طريقه ببسالة عبر كلاب الثلج، ولكن حتى طاقته الصاخبة
|
| 15 |
+
تفشل في إثارة هذه الكوميديا الرصاصية. '
|
| 16 |
+
- text: '... رحلة على متن قطار الملاهي في فيلم '
|
| 17 |
+
- text: 'مكتظة بالحادثة، ومليئة بالعاطفة والطاقة. '
|
| 18 |
+
- text: 'ربما يكون الأمر يتعلق بصناعة الأفلام، لكن لا حرج في ذلك إذا كان الفيلم مصنوعًا
|
| 19 |
+
بشكل جيد وهذا الفيلم كذلك. '
|
| 20 |
inference: true
|
| 21 |
model-index:
|
| 22 |
- name: SetFit with akhooli/sbert_ar_nli_500k_norm
|
|
|
|
| 30 |
split: test
|
| 31 |
metrics:
|
| 32 |
- type: accuracy
|
| 33 |
+
value: 0.8024948024948025
|
| 34 |
name: Accuracy
|
| 35 |
---
|
| 36 |
|
|
|
|
| 62 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
| 63 |
|
| 64 |
### Model Labels
|
| 65 |
+
| Label | Examples |
|
| 66 |
+
|:---------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 67 |
+
| negative | <ul><li>'بعد أن تضحك مرة -lrb- وربما مرتين -rrb-، ستكون قد نسيت الفيلم تمامًا عندما تعود إلى سيارتك في موقف السيارات. '</li><li>'أظن أن هذا هو نوع الإنتاج الذي كان من الممكن أن يكون أكثر تسلية لو أن المخرج قد أصدر مقتطفات بطريقة مسرحية واستخدم الفيلم كميزة إضافية على قرص DVD. '</li><li>'مسعى أكثر قابلية للتنبؤ ومليء بالكليشيهات من سابقه. '</li></ul> |
|
| 68 |
+
| positive | <ul><li>'تلبية، حتى تجاوز التوقعات، إنها أفضل تتمة منذ أن ضربت الإمبراطورية... إنجاز مهيب، ملحمة من العظمة المذهلة والعمق العاطفي المثير للدهشة. '</li><li>'في حين أن الوشم يستعير بشكل كبير من كليهما سبعة و صمت الحملان، فهو قادر على الحفاظ على مستوى من المؤامرات المتطورة والشخصيات ذات الحجم البشري التي تجذب الجمهور. '</li><li>'فيلم مضحك جدا . '</li></ul> |
|
| 69 |
|
| 70 |
## Evaluation
|
| 71 |
|
| 72 |
### Metrics
|
| 73 |
| Label | Accuracy |
|
| 74 |
|:--------|:---------|
|
| 75 |
+
| **all** | 0.8025 |
|
| 76 |
|
| 77 |
## Uses
|
| 78 |
|
|
|
|
| 92 |
# Download from the 🤗 Hub
|
| 93 |
model = SetFitModel.from_pretrained("akhooli/setfit")
|
| 94 |
# Run inference
|
| 95 |
+
preds = model("... رحلة على متن قطار الملاهي في فيلم ")
|
| 96 |
```
|
| 97 |
|
| 98 |
<!--
|
|
|
|
| 124 |
### Training Set Metrics
|
| 125 |
| Training set | Min | Median | Max |
|
| 126 |
|:-------------|:----|:-------|:----|
|
| 127 |
+
| Word count | 3 | 16.67 | 43 |
|
| 128 |
|
| 129 |
| Label | Training Sample Count |
|
| 130 |
|:---------|:----------------------|
|
| 131 |
+
| negative | 100 |
|
| 132 |
+
| positive | 100 |
|
| 133 |
|
| 134 |
### Training Hyperparameters
|
| 135 |
- batch_size: (32, 32)
|
| 136 |
+
- num_epochs: (5, 5)
|
| 137 |
+
- max_steps: 100
|
| 138 |
+
- sampling_strategy: undersampling
|
| 139 |
- body_learning_rate: (2e-05, 1e-05)
|
| 140 |
- head_learning_rate: 0.01
|
| 141 |
- loss: CosineSimilarityLoss
|
|
|
|
| 146 |
- warmup_proportion: 0.1
|
| 147 |
- l2_weight: 0.01
|
| 148 |
- seed: 42
|
| 149 |
+
- run_name: setfit_sst2
|
| 150 |
- eval_max_steps: -1
|
| 151 |
- load_best_model_at_end: False
|
| 152 |
|
| 153 |
### Training Results
|
| 154 |
+
| Epoch | Step | Training Loss | Validation Loss |
|
| 155 |
+
|:-----:|:----:|:-------------:|:---------------:|
|
| 156 |
+
| 0.02 | 1 | 0.3151 | - |
|
| 157 |
+
| 1.0 | 50 | 0.232 | - |
|
| 158 |
+
| 2.0 | 100 | 0.0379 | - |
|
|
|
|
|
|
|
| 159 |
|
| 160 |
### Framework Versions
|
| 161 |
- Python: 3.10.14
|
config_setfit.json
CHANGED
|
@@ -1,7 +1,7 @@
|
|
| 1 |
{
|
| 2 |
-
"normalize_embeddings": false,
|
| 3 |
"labels": [
|
| 4 |
"negative",
|
| 5 |
"positive"
|
| 6 |
-
]
|
|
|
|
| 7 |
}
|
|
|
|
| 1 |
{
|
|
|
|
| 2 |
"labels": [
|
| 3 |
"negative",
|
| 4 |
"positive"
|
| 5 |
+
],
|
| 6 |
+
"normalize_embeddings": false
|
| 7 |
}
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 540795752
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:df05034181c35b6caf20e38751c2f56a77431dacbe4b7f8912138aacedec6ec6
|
| 3 |
size 540795752
|
model_head.pkl
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 7007
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:15bfa7d20330e9fb5704c7ead92a26faf325a8c554e9eddc45194c99041a39a3
|
| 3 |
size 7007
|