NICFRU
/

nc_ner_bert_model_german_hyperparameter_grob

Model card Files Files and versions

NICFRU commited on Jul 12, 2025

Commit

6bc6d3e

·

verified ·

1 Parent(s): 3ee3e31

Update README.md

Files changed (1) hide show

README.md +25 -19

README.md CHANGED Viewed

@@ -1,31 +1,37 @@
 # nc_ner_bert_model
-This model is a fine-tuned version of bert-base-german-cased on the german-ler dataset.
-It achieves the following results on the evaluation set:
-Loss: 0.008934569545090199
-F1: 0.9751895889897949
-Precision: 0.9712793733681462
-Recall: 0.979131415679639
-## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
-## Training procedure
-### Training hyperparameters
-The following hyperparameters were used during training:
-- learning_rate: 4.523255542817897e-05
-- train_batch_size: (16,)
-- eval_batch_size: (16,)
-- num_epochs: 7
 ### Training results

 # nc_ner_bert_model
+Dieses Modell ist eine feinjustierte Variante von `bert-base-german-cased` und wurde auf dem `german-ler`-Datensatz mit **zusammengefassten (coarse) juristischen Entitäten** trainiert.
+Die ursprünglichen 19 Labels wurden auf 7 Oberkategorien reduziert, um eine robuste, generalisierbare NER-Leistung im juristischen Kontext zu ermöglichen.
+## Evaluationsergebnisse
+- **F1-Score**: 0.9752
+- **Precision**: 0.9713
+- **Recall**: 0.9791
+- **Loss**: 0.0089
+## Zusammengeführte Entitäten
+- **Personen**: `PER`, `RR`, `AN` → **PER**
+- **Orte**: `LD`, `ST`, `STR`, `LDS` → **LOC**
+- **Organisationen**: `ORG`, `UN`, `INN`, `GRT`, `MRK` → **ORG**
+- **Rechtsnormen**: `GS`, `VO`, `EUN` → **NRM**
+- **Regelwerke & Verträge**: `VS`, `VT` → **REG**
+- **Gerichtsentscheidungen**: `RS`
+- **Literatur**: `LIT`
+## Trainingskonfiguration
+- **Modell**: `bert-base-german-cased`
+- **Datensatz**: `german-ler` (BIO-annotiert)
+- **Trainingsepochen**: 7
+- **Batchgröße**: 16
+- **Lernrate**: ~4.52e-5
+## Nutzung
+Das Modell eignet sich für juristische NER-Anwendungen, bei denen eine robuste Extraktion relevanter Entitäten aus deutschsprachigen Rechtstexten erforderlich ist – z. B. in Schriftsatzanalyse, Vertragsprüfung oder juristischem Wissensmanagement.
 ### Training results