NICFRU
/

nc_ner_bert_model_german_grob

Model card Files Files and versions

NICFRU commited on Jul 12, 2025

Commit

f7f4a72

·

verified ·

1 Parent(s): a5b1d4d

Update README.md

Files changed (1) hide show

README.md +31 -4

README.md CHANGED Viewed

@@ -5,10 +5,37 @@ Die ursprünglichen 19 Labels wurden auf 7 Oberkategorien reduziert, um eine rob
 ## Evaluationsergebnisse
-- **F1-Score**: 0.9792212654436541
-- **Precision**: 0.9750232991612302
-- **Recall**: 0.9834555367550292
-- **Loss**:0.008847936056554317
 ## Zusammengeführte Entitäten

 ## Evaluationsergebnisse
+- **F1-Score (micro avg)**: 0.9792
+- **Precision (micro avg)**: 0.9750
+- **Recall (micro avg)**: 0.9835
+- **Loss**: 0.0088
+### Klassenweise Metriken (coarse level):
+| Klasse | Bedeutung               | Precision | Recall | F1-Score | Support |
+|--------|--------------------------|-----------|--------|----------|---------|
+| PER    | Person                  | 0.9563    | 0.9533 | 0.9548   | 321     |
+| ORG    | Organization            | 0.9799    | 0.9799 | 0.9799   | 796     |
+| RS     | Court decision          | 0.9872    | 0.9928 | 0.9900   | 1245    |
+| LIT    | Legal literature        | 0.9717    | 0.9841 | 0.9778   | 314     |
+| LOC    | Location                | 0.9252    | 0.9400 | 0.9325   | 250     |
+| NRM    | Legal norm              | 0.9854    | 0.9907 | 0.9880   | 2039    |
+| REG    | Case-by-case regul.     | 0.9200    | 0.9746 | 0.9465   | 354     |
+### Durchschnittswerte:
+- **Macro avg (F1)**: 0.9671
+- **Weighted avg (F1)**: 0.9793
+ ### Hinweis zur Metrikwahl
+Für die Gesamteinschätzung wird der **micro-average F1-Score** herangezogen, da hier **alle Vorhersagen gleich gewichtet** werden – unabhängig von der Klassengröße. Dies ist bei sequenzbasierten NER-Aufgaben sinnvoll, da jede Token-Entscheidung den gleichen Einfluss auf die Gesamtleistung hat.
+#### Überblick über die Metriktypen:
+- **Micro average**: Gesamtanzahl aller True Positives, False Positives und False Negatives → **alle Klassenbeiträge gleich gewichtet**
+- **Macro average**: Durchschnitt der Metriken über alle Klassen → **alle Klassen gleich wichtig**, unabhängig von Support
+- **Weighted average**: Durchschnitt über alle Klassen, **gewichtet nach Klassengröße** → größere Klassen haben mehr Einfluss
 ## Zusammengeführte Entitäten