SetFit with JohanHeinsen/Old_News_Segmentation_SBERT_V0.1

This is a SetFit model that can be used for Text Classification. This SetFit model uses JohanHeinsen/Old_News_Segmentation_SBERT_V0.1 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
0
  • '3) Da den i P. E. 146-7 ommeldte Bagersvend, Theodor Victor Holst Wildenrath endnu ikke er anholdt, gjentages Efterlysningen. (Falsters vestre Herred.'
  • '6) Robert Oscar Charles Friederichsen, født den 14 Juni 1874 i Kjøbenhavn, der ved Kjøbenhavns Kriminal- og Politirets Dom af 5 April et dømt til F. paa sædv. Fgk. i 14 Dage for Tyveri, er derefter udvandret til Buenos Ayres. Saafremt han atter skulde vende tilbage, bedes han anholdt. og Underretning til Kjøbenhavns Politi.'
  • '3) Hattefabrikant Vilhelm Lund af Aarhus, der d. 6. Ds. forlod Aarhuus pr. Jernbane paa en Forretningsrejse til Kjøbenhavn, er ikke senere ankommen hertil. Den 10. Ds, skal han have været i Fredericia. Underretning om hans Opholdsted hertil. (H. St.)'
1
  • '3) En Mandsperson, nogle og 20 Aar gl., middel at Højde og Bygning, lyst Haar, intet Skjæg, iført blaat Tøj og Kaskjet med blank Skygge, og er noget tunghør, sigtes for Tyveri. (St. 2).'
  • '6) En Sømandsdreng ved Navn Niels, 17 a 18 Aar gl., formentlig hjemmehørende i Randers, blond, middel af Højde og Bygning, iført blaa Jakkeklædning og flad Kaskjet med blanke Knapper, sigtes for Tyveri ombord i Skib. (St. 1, 917).'
  • '1) Henning William Andresen, født i Kbhvn., 13 Aar gl., spinkel af Bygning, mørkt Haar, brune Øine og bleg Ansigtsfarve, iført sort Klædes Trøie og Vest, mørke prikkede Benklæder og Støvler, – er den 4de ds. bortgaaet fra sit Hjem. (III).'

Evaluation

Metrics

Label Accuracy F1 Precision Recall
all 0.9665 0.9795 0.9702 0.9890

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("setfit_model_id")
# Run inference
preds = model("3) Pigen Dagmar Schrøder, Datter af Privatvægter Frederik Schrøder, Istedgade 6, 2. Sal, er den 24. Ds. bortgaaet fra Hjemmet. Hun er 12. Aar gl., svær af Bygning, har blondt Haar (Pandehaar, var iført rødbrun Nederdel, sort Liv, Sko og Sivhat med Blondebesætning. (H. St.)")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 7 55.4928 497
Label Training Sample Count
0 208
1 835

Training Hyperparameters

  • batch_size: (24, 24)
  • num_epochs: (1, 1)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 12
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0010 1 0.255 -
0.0479 50 0.136 -
0.0959 100 0.0552 -
0.1438 150 0.0385 -
0.1918 200 0.0237 -
0.2397 250 0.0175 -
0.2876 300 0.014 -
0.3356 350 0.0096 -
0.3835 400 0.0088 -
0.4314 450 0.0101 -
0.4794 500 0.008 -
0.5273 550 0.0051 -
0.5753 600 0.0036 -
0.6232 650 0.0006 -
0.6711 700 0.0002 -
0.7191 750 0.0001 -
0.7670 800 0.0002 -
0.8150 850 0.0001 -
0.8629 900 0.0001 -
0.9108 950 0.0001 -
0.9588 1000 0.0001 -

Framework Versions

  • Python: 3.11.12
  • SetFit: 1.1.3
  • Sentence Transformers: 4.1.0
  • Transformers: 4.51.3
  • PyTorch: 2.7.0
  • Datasets: 2.19.2
  • Tokenizers: 0.21.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
1
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for JohanHeinsen/PE_efterlyst_appearance

Paper for JohanHeinsen/PE_efterlyst_appearance

Evaluation results