Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

README.md +70 -50
config.json +3 -2
config_sentence_transformers.json +1 -1
config_setfit.json +2 -2
model.safetensors +1 -1
model_head.pkl +2 -2
tokenizer_config.json +1 -2

README.md CHANGED Viewed

@@ -5,11 +5,11 @@ tags:
 - text-classification
 - generated_from_setfit_trainer
 widget:
-- text: si, ¿que necesito saber?
-- text: salio a la tienda, no tarda
-- text: se nos murio
-- text: cuentame mas
-- text: por el momento no, muchas gracias
 metrics:
 - accuracy
 pipeline_tag: text-classification
@@ -28,7 +28,7 @@ model-index:
       split: test
     metrics:
     - type: accuracy
-      value: 0.9523809523809523
       name: Accuracy
 ---
@@ -48,7 +48,7 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Sentence Transformer body:** [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
-- **Number of Classes:** 13 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
@@ -60,28 +60,33 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
-| Label | Examples                                                                                                                  |
-|:------|:--------------------------------------------------------------------------------------------------------------------------|
-| 9     | <ul><li>'no, ahorita no'</li><li>'no autorizo que me llamen'</li><li>'no, ahorita no, oiga'</li></ul>                     |
-| 6     | <ul><li>'ya dejen de estar chingando'</li><li>'callate'</li><li>'voy a reportar este numero a la profeco'</li></ul>       |
-| 11    | <ul><li>'dame 5 minutos y te regreso la llamada'</li><li>'estoy comiendo, provecho'</li><li>'estoy trabajando'</li></ul>  |
-| 7     | <ul><li>'si, me puede explicar'</li><li>'cuenteme, por favor'</li><li>'expliqueme un poco mas'</li></ul>                  |
-| 1     | <ul><li>'¿quien busca?'</li><li>'¿a quien le llamo?'</li><li>'¿con quien quiere hablar usted?'</li></ul>                  |
-| 10    | <ul><li>'no se encuentra'</li><li>'no se encuentra, salio a trabajar'</li><li>'no esta, ¿gusta dejarle recado?'</li></ul> |
-| 5     | <ul><li>'murio hace tiempo'</li><li>'ya fallecio'</li><li>'fallecio ayer'</li></ul>                                       |
-| 12    | <ul><li>'¿para que es?'</li><li>'¿de donde llaman?'</li><li>'¿que empresa es?'</li></ul>                                  |
-| 3     | <ul><li>'numero equivocado'</li><li>'no vive aqui'</li><li>'esta equivocada senorita'</li></ul>                           |
-| 2     | <ul><li>'hasta luego'</li><li>'gracias, bye'</li><li>'adios'</li></ul>                                                    |
-| 4     | <ul><li>'deja te comunico con el'</li><li>'permiteme un segundo, no me cuelgues'</li><li>'aguantame tantito'</li></ul>    |
-| 8     | <ul><li>'¿como?'</li><li>'mande'</li><li>'hable mas fuerte que no le oigo'</li></ul>                                      |
-| 0     | <ul><li>'si, el habla'</li><li>'servidor'</li><li>'con el'</li></ul>                                                      |
 ## Evaluation
 ### Metrics
 | Label   | Accuracy |
 |:--------|:---------|
-| **all** | 0.9524   |
 ## Uses
@@ -101,7 +106,7 @@ from setfit import SetFitModel
 # Download from the 🤗 Hub
 model = SetFitModel.from_pretrained("setfit_model_id")
 # Run inference
-preds = model("se nos murio")
 ```
 <!--
@@ -133,23 +138,28 @@ preds = model("se nos murio")
 ### Training Set Metrics
 | Training set | Min | Median | Max |
 |:-------------|:----|:-------|:----|
-| Word count   | 1   | 3.7514 | 11  |
 | Label | Training Sample Count |
 |:------|:----------------------|
-| 0     | 7                     |
-| 1     | 11                    |
-| 2     | 5                     |
-| 3     | 6                     |
-| 4     | 9                     |
-| 5     | 12                    |
-| 6     | 11                    |
-| 7     | 33                    |
-| 8     | 13                    |
-| 9     | 48                    |
-| 10    | 8                     |
 | 11    | 13                    |
-| 12    | 5                     |
 ### Training Hyperparameters
 - batch_size: (16, 16)
@@ -174,26 +184,36 @@ preds = model("se nos murio")
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
-| 0.0022 | 1    | 0.25          | -               |
-| 0.1104 | 50   | 0.1543        | -               |
-| 0.2208 | 100  | 0.0482        | -               |
-| 0.3311 | 150  | 0.03          | -               |
-| 0.4415 | 200  | 0.0137        | -               |
-| 0.5519 | 250  | 0.0122        | -               |
-| 0.6623 | 300  | 0.0057        | -               |
-| 0.7726 | 350  | 0.0036        | -               |
-| 0.8830 | 400  | 0.0031        | -               |
-| 0.9934 | 450  | 0.005         | -               |
-| 1.0    | 453  | -             | 0.0190          |
 ### Framework Versions
 - Python: 3.12.12
 - SetFit: 1.1.3
 - Sentence Transformers: 5.2.2
-- Transformers: 4.57.6
 - PyTorch: 2.9.0+cu126
 - Datasets: 4.0.0
-- Tokenizers: 0.22.2
 ## Citation

 - text-classification
 - generated_from_setfit_trainer
 widget:
+- text: soy quien busca
+- text: adios, buenas tardes
+- text: no se encuentra
+- text: yo le puedo pasar el mensaje
+- text: quizas funcione
 metrics:
 - accuracy
 pipeline_tag: text-classification
       split: test
     metrics:
     - type: accuracy
+      value: 0.9111111111111111
       name: Accuracy
 ---
 - **Sentence Transformer body:** [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
+- **Number of Classes:** 18 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
+| Label | Examples                                                                                                                             |
+|:------|:-------------------------------------------------------------------------------------------------------------------------------------|
+| 14    | <ul><li>'tengo otro prestamo activo'</li><li>'mi historial esta mal'</li><li>'tengo credito con otra financiera'</li></ul>           |
+| 11    | <ul><li>'hable mas fuerte'</li><li>'se oye muy lejos'</li><li>'se corta'</li></ul>                                                   |
+| 15    | <ul><li>'ahorita voy manejando, hablame luego'</li><li>'ahorita no puedo atenderte, estoy ocupado'</li><li>'voy manejando'</li></ul> |
+| 7     | <ul><li>'ya fallecio'</li><li>'ya no esta con nosotros'</li><li>'el ya no vive'</li></ul>                                            |
+| 4     | <ul><li>'adios, buenas noches'</li><li>'bueno, gracias, adios'</li><li>'listo, hasta luego'</li></ul>                                |
+| 10    | <ul><li>'si, quiero saber'</li><li>'si, digame rapido'</li><li>'te escucho'</li></ul>                                                |
+| 12    | <ul><li>'no, joven, muchas gracias'</li><li>'no, oiga, gracias'</li><li>'no, por ahora paso, gracias'</li></ul>                      |
+| 17    | <ul><li>'bueno, diga'</li><li>'si'</li><li>'si, diga'</li></ul>                                                                      |
+| 3     | <ul><li>'si, a ver de que se trata'</li><li>'tal vez si'</li><li>'esta bien, envialo'</li></ul>                                      |
+| 5     | <ul><li>'no corresponde ese numero'</li><li>'esta llamando al numero equivocado'</li><li>'aqui no vive esa persona'</li></ul>        |
+| 8     | <ul><li>'¿me da la direccion de sus oficinas?'</li><li>'yo no les di mi telefono'</li><li>'yo no le di mis datos a nadie'</li></ul>  |
+| 0     | <ul><li>'soy su hermana'</li><li>'esta bajo tratamiento'</li><li>'se siente mal'</li></ul>                                           |
+| 16    | <ul><li>'¿quien me llama?'</li><li>'¿de que empresa llaman?'</li><li>'¿quien es?'</li></ul>                                          |
+| 1     | <ul><li>'habla el senor'</li><li>'con ella habla'</li><li>'si aqui habla'</li></ul>                                                  |
+| 6     | <ul><li>'un momento por favor'</li><li>'deja le hablo'</li><li>'permiteme un segundo, no me cuelgues'</li></ul>                      |
+| 2     | <ul><li>'¿con quien quiere hablar?'</li><li>'¿quien busca?'</li><li>'¿a quien esta buscando?'</li></ul>                              |
+| 9     | <ul><li>'no esten chingando'</li><li>'es la quinta vez que me marcan hoy'</li><li>'¡que no entiendes que no!'</li></ul>              |
+| 13    | <ul><li>'salio a la tienda, no tarda'</li><li>'ahorita no esta, anda de viaje'</li><li>'anda trabajando'</li></ul>                   |
 ## Evaluation
 ### Metrics
 | Label   | Accuracy |
 |:--------|:---------|
+| **all** | 0.9111   |
 ## Uses
 # Download from the 🤗 Hub
 model = SetFitModel.from_pretrained("setfit_model_id")
 # Run inference
+preds = model("soy quien busca")
 ```
 <!--
 ### Training Set Metrics
 | Training set | Min | Median | Max |
 |:-------------|:----|:-------|:----|
+| Word count   | 1   | 3.9018 | 11  |
 | Label | Training Sample Count |
 |:------|:----------------------|
+| 0     | 32                    |
+| 1     | 18                    |
+| 2     | 11                    |
+| 3     | 18                    |
+| 4     | 18                    |
+| 5     | 22                    |
+| 6     | 9                     |
+| 7     | 12                    |
+| 8     | 40                    |
+| 9     | 11                    |
+| 10    | 33                    |
 | 11    | 13                    |
+| 12    | 48                    |
+| 13    | 8                     |
+| 14    | 36                    |
+| 15    | 13                    |
+| 16    | 18                    |
+| 17    | 37                    |
 ### Training Hyperparameters
 - batch_size: (16, 16)
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
+| 0.0010 | 1    | 0.3888        | -               |
+| 0.0504 | 50   | 0.211         | -               |
+| 0.1007 | 100  | 0.1344        | -               |
+| 0.1511 | 150  | 0.0742        | -               |
+| 0.2014 | 200  | 0.0484        | -               |
+| 0.2518 | 250  | 0.0387        | -               |
+| 0.3021 | 300  | 0.0264        | -               |
+| 0.3525 | 350  | 0.0183        | -               |
+| 0.4028 | 400  | 0.0135        | -               |
+| 0.4532 | 450  | 0.0115        | -               |
+| 0.5035 | 500  | 0.0082        | -               |
+| 0.5539 | 550  | 0.0083        | -               |
+| 0.6042 | 600  | 0.0073        | -               |
+| 0.6546 | 650  | 0.009         | -               |
+| 0.7049 | 700  | 0.0067        | -               |
+| 0.7553 | 750  | 0.0075        | -               |
+| 0.8056 | 800  | 0.0085        | -               |
+| 0.8560 | 850  | 0.0073        | -               |
+| 0.9063 | 900  | 0.0065        | -               |
+| 0.9567 | 950  | 0.0076        | -               |
+| 1.0    | 993  | -             | 0.0437          |
 ### Framework Versions
 - Python: 3.12.12
 - SetFit: 1.1.3
 - Sentence Transformers: 5.2.2
+- Transformers: 4.44.2
 - PyTorch: 2.9.0+cu126
 - Datasets: 4.0.0
+- Tokenizers: 0.19.1
 ## Citation

config.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
   "architectures": [
     "BertModel"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
-  "dtype": "float32",
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
@@ -19,7 +19,8 @@
   "output_past": true,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
-  "transformers_version": "4.57.6",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 31002

 {
+  "_name_or_path": "hiiamsid/sentence_similarity_spanish_es",
   "architectures": [
     "BertModel"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "output_past": true,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 31002

config_sentence_transformers.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "__version__": {
     "sentence_transformers": "5.2.2",
-    "transformers": "4.57.6",
     "pytorch": "2.9.0+cu126"
   },
   "model_type": "SentenceTransformer",

 {
   "__version__": {
     "sentence_transformers": "5.2.2",
+    "transformers": "4.44.2",
     "pytorch": "2.9.0+cu126"
   },
   "model_type": "SentenceTransformer",

config_setfit.json CHANGED Viewed

@@ -1,4 +1,4 @@
 {
-  "normalize_embeddings": false,
-  "labels": null
 }

 {
+  "labels": null,
+  "normalize_embeddings": false
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:974fa8bccbf172e0d06c5f65a7b152e46bc76e0ace6385c0a35cac54d6cc98ba
 size 439425888

 version https://git-lfs.github.com/spec/v1
+oid sha256:69618ae50cf5d9badf705bfa0d831bafedcfe359c65440434d337da90ae5caff
 size 439425888

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f7f44c823415a45b366f3e81b81531a109ab18797bc982c971d50b960988f605
-size 80927

 version https://git-lfs.github.com/spec/v1
+oid sha256:546fe46dd5fed7c63dfe7f1ca36775a3710f7f6b3c9ed2b93bdaa3aa461e94ad
+size 111719

tokenizer_config.json CHANGED Viewed

@@ -41,11 +41,10 @@
       "special": true
     }
   },
-  "clean_up_tokenization_spaces": false,
   "cls_token": "[CLS]",
   "do_basic_tokenize": true,
   "do_lower_case": false,
-  "extra_special_tokens": {},
   "mask_token": "[MASK]",
   "max_length": 512,
   "model_max_length": 512,

       "special": true
     }
   },
+  "clean_up_tokenization_spaces": true,
   "cls_token": "[CLS]",
   "do_basic_tokenize": true,
   "do_lower_case": false,
   "mask_token": "[MASK]",
   "max_length": 512,
   "model_max_length": 512,