Update README.md
Browse files
README.md
CHANGED
|
@@ -4,14 +4,18 @@ widget:
|
|
| 4 |
example_title: "de/dem exempel 1"
|
| 5 |
- text: "Jag såg de komma runt hörnet och gå i riktning mot dem byggnaderna."
|
| 6 |
example_title: "de/dem exempel 2"
|
|
|
|
|
|
|
| 7 |
---
|
| 8 |
|
| 9 |
## DeFormer
|
| 10 |
|
| 11 |
DeFormer är en modell som har tränats på att skilja mellan `de` och `dem` i svenska meningar. Modellen kan testas direkt i panelerna till höger under **Hosted Inference API** genom att skriva in en mening och trycka på **Compute**.
|
| 12 |
|
| 13 |
-
**
|
| 14 |
-
|
|
|
|
|
|
|
| 15 |
|
| 16 |
## Träningsdata
|
| 17 |
DeFormer har tränats på meningar från Europarlamentet och svenskspråkiga Wikimedia. Dessa hämtades från [OPUS](https://opus.nlpl.eu/). Källorna valdes ut för att de antogs ha ett korrekt språkbruk.
|
|
@@ -30,8 +34,11 @@ Vid träningen av DeFormer introducerades slumpmässiga substitioner, där `de`
|
|
| 30 |
1. **`ord`** (alla bakgrundsord som inte är de/dem tillhör denna kategori)
|
| 31 |
2. **`DE`**
|
| 32 |
3. **`DEM`**
|
|
|
|
|
|
|
|
|
|
| 33 |
|
| 34 |
-
Innan observationerna skickades in till modellträning byttes `de` ut mot `dem` med
|
| 35 |
|
| 36 |
## Träffsäkerhet/Accuracy
|
| 37 |
|
|
|
|
| 4 |
example_title: "de/dem exempel 1"
|
| 5 |
- text: "Jag såg de komma runt hörnet och gå i riktning mot dem byggnaderna."
|
| 6 |
example_title: "de/dem exempel 2"
|
| 7 |
+
- text: "de är ganska tråkigt att de blivit såhär, men de va de ända jag kunde göra"
|
| 8 |
+
example_title: "enda/ända och de(t)"
|
| 9 |
---
|
| 10 |
|
| 11 |
## DeFormer
|
| 12 |
|
| 13 |
DeFormer är en modell som har tränats på att skilja mellan `de` och `dem` i svenska meningar. Modellen kan testas direkt i panelerna till höger under **Hosted Inference API** genom att skriva in en mening och trycka på **Compute**.
|
| 14 |
|
| 15 |
+
**Uppdatering 2023-05-06:** Modellen kan nu hantera även borttappade t:n i de**t**. Den nya versionen har tränats till att skilja mellan de, det och dem; samt enda och ända.
|
| 16 |
+
|
| 17 |
+
**Instruktioner:**
|
| 18 |
+
Använd endast de/dem/enda/ända med små bokstäver vid testning. Vid träning av modellen gjordes alla "De" och "Dem" om till gemener.
|
| 19 |
|
| 20 |
## Träningsdata
|
| 21 |
DeFormer har tränats på meningar från Europarlamentet och svenskspråkiga Wikimedia. Dessa hämtades från [OPUS](https://opus.nlpl.eu/). Källorna valdes ut för att de antogs ha ett korrekt språkbruk.
|
|
|
|
| 34 |
1. **`ord`** (alla bakgrundsord som inte är de/dem tillhör denna kategori)
|
| 35 |
2. **`DE`**
|
| 36 |
3. **`DEM`**
|
| 37 |
+
4. **`DET`**
|
| 38 |
+
5. **`ENDA`**
|
| 39 |
+
6. **`ÄNDA`**
|
| 40 |
|
| 41 |
+
Innan observationerna skickades in till modellträning byttes `de` ut mot `det` eller `dem` med cirka 50 procents sannolikhet, medan `dem` byttes till `de` i 40 procent av fallen. Liknande substutioner gjordes för `enda` och `ända`.
|
| 42 |
|
| 43 |
## Träffsäkerhet/Accuracy
|
| 44 |
|