| title: Zero-Shot Interface | |
| name: huggingface/Sahajtomar/German_Zeroshot | |
| description: > | |
| Bei dieser Aufgabe handelt es sich um eine Textklassifizierungsaufgabe. Das heißt, das Modell | |
| bekommt einen Textinhalt vorgelegt und muss aus einer Liste vordefinierter Labels entscheiden, | |
| welches dieser Labels den Inhalt des Textes am besten beschreibt. Der Krux bei der ganzen Sache ist, | |
| dass das Modell keine Spezialisierung für die Labels erfahren hat und sozusagen beim ersten Mal die | |
| richtige Auswahl treffen muss; daher zero shot, denn es hat nur einen Versuch. Erreicht wird dies, in | |
| dem ein vortrainiertes Modell auf einen Datensatz für Natural Language Inference (dt. natürlichsprachliche | |
| Inferenz oder Rückschluss auf natürliche Sprache) spezialisiert wird. Bei dieser Aufgabe bekommt | |
| das Modell zwei Texte vorgelegt und muss lernen, in welchem Verhältnis die beiden Texte zueinanderstehen. | |
| Folgende Klassen stehen dabei zur Auswahl: | |
| Entailment: Text A ist eine logische Schlussfolgerung von Text B | |
| Contradiction: Text A steht im Widerspruch zu Text B | |
| Neutral: es lassen sich keine Schlussfolgerungen dieser Art ziehen | |
| </br> | |
| Nehmen wir als Beispiel den Ausgangstext «Die Kinder lächeln und winken in die Kamera». Nach der Spezialisierung | |
| sollte das Modell in der Lage sein zu sagen, dass die Aussage «Es sind Kinder anwesend.» eine logische | |
| Schlussfolgerung des Ausgangstextes ist, während die Aussage «Die Kinder runzeln die Stirn.» im Widerspruch | |
| zum Ausgangstext steht. | |
| </br> | |
| Es hat sich gezeigt, dass Modelle, die auf Natural Language Inference spezialisiert wurden, auch sehr gut darin sind, | |
| Texten thematisch passende Labels zuzuordnen. Wenn wir wieder den Ausgangstext von vorhin nehmen, wäre das Modell in | |
| der Lage zu sagen, dass von den möglichen Kandidatenlabels [Wirtschaft, Familie, Feier, Tragödie] Familie und Feier | |
| diejenigen Labels sind, die den Inhalt des Textes am besten beschreiben.</br></br>Das hier verwendete Beispielmodell | |
| wurde auf deutschsprachige Texte trainiert. | |
| examples: | |
| - | |
| - > | |
| COVID-19 (Akronym von englisch coronavirus disease 2019, deutsch Coronavirus-Krankheit-2019), in den | |
| deutschsprachigen Ländern umgangssprachlich meist nur als „Corona“ oder „Covid“ bezeichnet, ist eine | |
| meldepflichtige Infektionskrankheit mit einem breiten aber unspezifischen Symptomspektrum, die durch eine | |
| Infektion (Ansteckung) mit dem Betacoronavirus SARS-CoV-2 verursacht wird. Das Virus wurde erstmals im | |
| Dezember 2019 in Wuhan (Volksrepublik China) beschrieben. Es verbreitete sich sehr schnell weltweit und ist | |
| Ursache der COVID-19-Pandemie. Bis 18. Oktober 2022 wurden weltweit rund 622 Millionen COVID-Infizierte registriert, | |
| es wird aber in vielen Ländern eine hohe Dunkelziffer vermutet. Laut einer Schätzung der Weltgesundheitsorganisation | |
| (WHO) gab es zwischen Anfang 2020 und Ende 2021 eine weltweite, durch COVID-19 verursachte Übersterblichkeit von | |
| 14,83 Millionen Toten. | |
| - | |
| - Wirtschaft | |
| - Familie | |
| - Politik | |
| - Finanzen | |
| - Medizin | |
| - Gesundheit | |
| - True | |