JohanHeinsen's picture
Push model using huggingface_hub.
1484d0a verified
metadata
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: >-
      1) Niels Budelsen, svensk Arbejdsmand, nogle og 20 Aar gl., middelhøj,
      lyst Haar, intet Skjæg, iført enten graabrune hvergarns Klæder eller graa
      Buckskins Benklæder og Vestengelsk Hue eller sort rundpullet Hat og
      skident hvidt Halstørklæde, sigtes for Tyveri. Anholdes hertil. (St. 2,
      770.)
  - text: >-
      1) Hans Hansen, Arbejdsmand, født den 12/12 52 Fuldby, middel af Højde og
      Bygning, rødt Hageskjæg, er igaar undvegen fra Frederiksberg Fattighus.
      Ved Borgangen var han iført graa islandsk Nattrøje, gl. mørk Vest, sorte
      Benklæder, LærredsSkjorte, mrk. F. F., flad graa Kaskjet og Træsko.
      Anholdes til K. A. søndre Birk.
  - text: >-
      3) Kolportør Olsen, der rejser for N. C. Rom og formentlig for Tiden
      rejser i det nordlige Jylland, eftersøges i Anledning af at han har
      forladt sit Logis uden at betale. I Antræffelsestilfælde udbedes
      Underretning om hans Opholdsted til Byfogden i Vejle, hvorefter Begjæring
      om hans Afhøring vil blive fremsendt.
  - text: >-
      3) Pigen Dagmar Schrøder, Datter af Privatvægter Frederik Schrøder,
      Istedgade 6, 2. Sal, er den 24. Ds. bortgaaet fra Hjemmet. Hun er 12. Aar
      gl., svær af Bygning, har blondt Haar (Pandehaar, var iført rødbrun
      Nederdel, sort Liv, Sko og Sivhat med Blondebesætning. (H. St.)
  - text: >-
      2) Lauriz Christian Carl Mariager, omtrent 29 Aar gl., født i Kjøbenhavn,
      over Middelhøjde, med mørkt Haar, lidt Overskjæg, smalt blegt Ansigt,
      iført blaa Stortrøje, Benklæder, blaa engelsk Kaskjet med lige udstaaende
      Skygge, sigtes for Bedrageri. Anh. hertil. (St. 2. 1025.)
metrics:
  - accuracy
  - f1
  - precision
  - recall
pipeline_tag: text-classification
library_name: setfit
inference: true
base_model: JohanHeinsen/Old_News_Segmentation_SBERT_V0.1
model-index:
  - name: SetFit with JohanHeinsen/Old_News_Segmentation_SBERT_V0.1
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: accuracy
            value: 0.96875
            name: Accuracy
          - type: f1
            value: 0.8703703703703703
            name: F1
          - type: precision
            value: 0.8545454545454545
            name: Precision
          - type: recall
            value: 0.8867924528301887
            name: Recall

SetFit with JohanHeinsen/Old_News_Segmentation_SBERT_V0.1

This is a SetFit model that can be used for Text Classification. This SetFit model uses JohanHeinsen/Old_News_Segmentation_SBERT_V0.1 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
0
  • '3) Da den i P. E. 146-7 ommeldte Bagersvend, Theodor Victor Holst Wildenrath endnu ikke er anholdt, gjentages Efterlysningen. (Falsters vestre Herred.'
  • '3) En Mandsperson, nogle og 20 Aar gl., middel at Højde og Bygning, lyst Haar, intet Skjæg, iført blaat Tøj og Kaskjet med blank Skygge, og er noget tunghør, sigtes for Tyveri. (St. 2).'
  • '6) En Sømandsdreng ved Navn Niels, 17 a 18 Aar gl., formentlig hjemmehørende i Randers, blond, middel af Højde og Bygning, iført blaa Jakkeklædning og flad Kaskjet med blanke Knapper, sigtes for Tyveri ombord i Skib. (St. 1, 917).'
1
  • '3) Ole Mele, Skræder, hjemmehørende i Stavanger, omtr. 35 Aar gl., middel af Væxt og Bygning, lyst Haar samt Over- og Fipskjæg, blegAnsigtsfarve, – sigtes for bedrageligt Forholdi Helsingør. Det bemærkes, at han tidligere har faret tilsøes og at det antages, at han i Tirsdags har begivet sig hertil Staden. Anholdes til Byfogden i Helsingør.'
  • 'Efterlysninger. Matros William Andersson, født i Gøteborg, 28 Aar gl., over Middelhøjde, blondt Haar, lidt Over- og Hageskjæg, iført blaa uldne Benklæder, do. Vest og gl. falmet Stortrøje samt skotsk Hue med Skygge, sigtes for Hyrebesvigelse. Anholdes og Underretning hertil. (H. St., 3250.)'
  • '4) Tre svenske Jernbanearbejdere: a) Måns Månsson, f. den 18. Juli 1857 i CimrisChristianstads Lehn, middel af Højde og Bygning, blaa Øjne, lyst Haar; b) Anders Larsson, født den 17. Septbr. 1851 i Svedall, Malmøhus Lehn, middel af Højde, stærk Bygning, blaa Øjne, lyst Haar, og c) Nils Olsson, f. den 5. Marts 1861 i Anderløff, Malmøhus Lehn, middel af Højde og Bygning, blaa Øjne, blondt Haar, alle anstændig klædte i mørke Klæder og Læderfodtøj, forsynede med ny Opholdsbog fra By- og Herredskontoret i Faaborg, ere Natten til den 15. d. M. bortrømte fra deres Logis i Hillerslev, efterladende en Gjæld for Kost og Logis henholdsvis 2 Kr. 40 Øre, 3 Kr. 50 Øre og 3 Kr. 75 Øre, og have, dog muligviis paa Skrømt, omtalt at ville søge Arbeide i eller ved Kjøbenhavn da de meldte Afgang for vedkommende Politiassistent. I Antræffelsestilfælde bedes de affordret de skyldige Beløb, samt, saafremt dette ikke betales, anholdte og Underretning meddelt til Muckadell Birk.'

Evaluation

Metrics

Label Accuracy F1 Precision Recall
all 0.9688 0.8704 0.8545 0.8868

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("setfit_model_id")
# Run inference
preds = model("3) Pigen Dagmar Schrøder, Datter af Privatvægter Frederik Schrøder, Istedgade 6, 2. Sal, er den 24. Ds. bortgaaet fra Hjemmet. Hun er 12. Aar gl., svær af Bygning, har blondt Haar (Pandehaar, var iført rødbrun Nederdel, sort Liv, Sko og Sivhat med Blondebesætning. (H. St.)")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 7 55.4928 497
Label Training Sample Count
0 938
1 105

Training Hyperparameters

  • batch_size: (24, 24)
  • num_epochs: (1, 1)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 10
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0011 1 0.3025 -
0.0575 50 0.2703 -
0.1149 100 0.0787 -
0.1724 150 0.0277 -
0.2299 200 0.0231 -
0.2874 250 0.0143 -
0.3448 300 0.0048 -
0.4023 350 0.0078 -
0.4598 400 0.0029 -
0.5172 450 0.002 -
0.5747 500 0.0005 -
0.6322 550 0.0001 -
0.6897 600 0.0004 -
0.7471 650 0.0004 -
0.8046 700 0.0002 -
0.8621 750 0.0001 -
0.9195 800 0.0001 -
0.9770 850 0.0001 -

Framework Versions

  • Python: 3.11.12
  • SetFit: 1.1.3
  • Sentence Transformers: 4.1.0
  • Transformers: 4.51.3
  • PyTorch: 2.7.0
  • Datasets: 2.19.2
  • Tokenizers: 0.21.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}