Text Classification
Transformers
TensorBoard
Safetensors
German
xlm-roberta
Generated from Trainer
text-embeddings-inference
Instructions to use ubffm/academic_text_classifier_de with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use ubffm/academic_text_classifier_de with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-classification", model="ubffm/academic_text_classifier_de")# Load model directly from transformers import AutoTokenizer, AutoModelForSequenceClassification tokenizer = AutoTokenizer.from_pretrained("ubffm/academic_text_classifier_de") model = AutoModelForSequenceClassification.from_pretrained("ubffm/academic_text_classifier_de") - Notebooks
- Google Colab
- Kaggle
Update README.md
Browse files
README.md
CHANGED
|
@@ -46,7 +46,7 @@ Intended uses:
|
|
| 46 |
|
| 47 |
Limitations:
|
| 48 |
|
| 49 |
-
- training and evaluation data is limited to
|
| 50 |
|
| 51 |
## How to run
|
| 52 |
|
|
@@ -131,13 +131,15 @@ Definitions or findings written in point form are challenging for the model. For
|
|
| 131 |
|
| 132 |
Excerpts from Hüning, M. (2002). Zwischen Deutsch und Englisch–Aspekte der sprachlichen Identität des Niederländischen. na. retrieved from https://neon.niederlandistik.fu-berlin.de/static/mh/Taal_en_identiteit.pdf
|
| 133 |
|
| 134 |
-
Instances with a higher percentage of numbers can be misclassified as non-main text:
|
|
|
|
| 135 |
- 2 Zwischen Deutsch und Englisch 2.1 Genera Als ein bekanntes und auffälliges Beispiel für die Mittelstellung des Niederländischen nennt Van Haeringen (1956:28) das Genus.1
|
| 136 |
|
| 137 |
Numbered sub-titles and footnotes can be mistaken as examples:
|
|
|
|
| 138 |
- (23) Variation im Mittelniederländischen
|
|
|
|
| 139 |
- (13) Adnominale Intensifikatoren (a) Den ersten Vortrag hielt Van Uffelen selbst/selber. (b) De eerste lezing werd gehouden door Van Uffelen zelf.
|
| 140 |
-
-
|
| 141 |
|
| 142 |
## Training and evaluation data
|
| 143 |
|
|
|
|
| 46 |
|
| 47 |
Limitations:
|
| 48 |
|
| 49 |
+
- training and evaluation data is limited to German, and academic texts in Linguistics (though still to a higher extent usable for English texts)
|
| 50 |
|
| 51 |
## How to run
|
| 52 |
|
|
|
|
| 131 |
|
| 132 |
Excerpts from Hüning, M. (2002). Zwischen Deutsch und Englisch–Aspekte der sprachlichen Identität des Niederländischen. na. retrieved from https://neon.niederlandistik.fu-berlin.de/static/mh/Taal_en_identiteit.pdf
|
| 133 |
|
| 134 |
+
Instances with a higher percentage of numbers (such as subtitles) can be misclassified as non-main text:
|
| 135 |
+
|
| 136 |
- 2 Zwischen Deutsch und Englisch 2.1 Genera Als ein bekanntes und auffälliges Beispiel für die Mittelstellung des Niederländischen nennt Van Haeringen (1956:28) das Genus.1
|
| 137 |
|
| 138 |
Numbered sub-titles and footnotes can be mistaken as examples:
|
| 139 |
+
|
| 140 |
- (23) Variation im Mittelniederländischen
|
| 141 |
+
|
| 142 |
- (13) Adnominale Intensifikatoren (a) Den ersten Vortrag hielt Van Uffelen selbst/selber. (b) De eerste lezing werd gehouden door Van Uffelen zelf.
|
|
|
|
| 143 |
|
| 144 |
## Training and evaluation data
|
| 145 |
|