NICFRU
/

nc_ner_bert_model_german_grob

Model card Files Files and versions

NICFRU commited on Jul 12, 2025

Commit

a5b1d4d

·

verified ·

1 Parent(s): 18fb415

Update README.md

Files changed (1) hide show

README.md +27 -20

README.md CHANGED Viewed

@@ -1,31 +1,38 @@
-# nc_ner_bert_model
-This model is a fine-tuned version of bert-base-german-cased on the german-ler dataset.
-It achieves the following results on the evaluation set:
-Loss: 0.008847936056554317
-F1: 0.9792212654436541
-Precision: 0.9750232991612302
-Recall: 0.9834555367550292
-## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
-## Training procedure
-### Training hyperparameters
-The following hyperparameters were used during training:
-- learning_rate: 2e-05
-- train_batch_size: 32
-- eval_batch_size: 32
-- num_epochs: 6
 ### Training results

+# nc_ner_bert_model_german_grob
+Dieses Modell ist eine feinjustierte Variante von `bert-base-german-cased` und wurde auf dem `german-ler`-Datensatz mit **zusammengefassten (coarse) juristischen Entitäten** trainiert.
+Die ursprünglichen 19 Labels wurden auf 7 Oberkategorien reduziert, um eine robuste, generalisierbare NER-Leistung im juristischen Kontext zu ermöglichen.
+## Evaluationsergebnisse
+- **F1-Score**: 0.9792212654436541
+- **Precision**: 0.9750232991612302
+- **Recall**: 0.9834555367550292
+- **Loss**:0.008847936056554317
+## Zusammengeführte Entitäten
+- **Personen**: `PER`, `RR`, `AN` → **PER**
+- **Orte**: `LD`, `ST`, `STR`, `LDS` → **LOC**
+- **Organisationen**: `ORG`, `UN`, `INN`, `GRT`, `MRK` → **ORG**
+- **Rechtsnormen**: `GS`, `VO`, `EUN` → **NRM**
+- **Regelwerke & Verträge**: `VS`, `VT` → **REG**
+- **Gerichtsentscheidungen**: `RS`
+- **Literatur**: `LIT`
+## Trainingskonfiguration
+- **Modell**: `bert-base-german-cased`
+- **Datensatz**: `german-ler` (BIO-annotiert)
+- **Trainingsepochen**: 6
+- **Batchgröße**: 32
+- **Lernrate**: 2e-5
+- **Evaluation alle**: 200 Schritte
+- **Selektion nach**: F1-Score (Bestes Modell gespeichert)
+## Nutzung
+Das Modell eignet sich für juristische NER-Anwendungen, bei denen eine robuste Extraktion relevanter Entitäten aus deutschsprachigen Rechtstexten erforderlich ist – z. B. in Schriftsatzanalyse, Vertragsprüfung oder juristischem Wissensmanagement.
 ### Training results