Sentence Similarity
sentence-transformers
Safetensors
German
xlm-roberta
feature-extraction
Generated from Trainer
dataset_size:51106
loss:AnglELoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use Sami92/multiling-e5-large-instruct-claim-matching with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use Sami92/multiling-e5-large-instruct-claim-matching with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("Sami92/multiling-e5-large-instruct-claim-matching") sentences = [ "Instruct: Retrieve semantically similar text.\nQuery: Medwedew über die Entsendung von NATO-Truppen in die Ukraine: „Die Entsendung von NATO-Truppen auf das Territorium der Ukraine wird den direkten Eintritt dieser Länder in den Krieg bedeuten, worauf wir (Russland) mit (...) reagieren müssen. Es wird eine Weltkatastrophe werden.“", "Dipl.-Pol. Udo Walendy (1927-2022) spricht klare Worte über die machtpolitischen Hintergründe der gegen Deutschland gerichteten Greuelpropaganda und Geschichtsfälschung... Anmerkung: In dem konkreten Fall verbreitete Kohl (alias Henoch Kohn) die Mär vom Zigeuner-Massenmord. Während Walendy noch ungestraft nachfragen konnte, woher denn die angeblichen Opferzahlen stammten, hat man ja bspw. Ursula Haverbeck direkt vor Gericht gezerrt... Der Unterschied war bloß: Es waren ein paar Jahrzehnte dazwischen. Die Geschichtslügen wurden ja zwischenzeitlich strafrechtlich abgesichert und quasi manifestiert. (§130) Beachtenswert ist natürlich der Umstand, daß vermeintlich \"deutsche\" Politiker von Brandt bis Scholz diese (Sieger-Propaganda-) Lügen gebetsmühlenartig wiederholen... EIGENE Politiker?!... MITNICHTEN!", "Der Pharmamafia !!! Um Umsatz und Gewinne für die Zunkunft nicht nur zu sichern, sondern exorbitant zu steigern, gilt es alle gesunden Kinder weltweit, direkt nach der Geburt krank zu spritzen. ‼ HIER WIR IMPFEN NICHT ! Dokumentarfilm ‼ Denn Impfen wirkt, nur halt anders als behauptet. Ganz wichtig ist dabei ist es nach Möglichkeit die Spritzen zur allgemeinen Pflicht zu erklären, denn nur so können die verhindern, daß dieses abschäuliche Treiben, wegen einer ungeimpften Kontrollgruppe, augenscheinlich ist. <URL> <URL>", "UPDATE Nach Angaben des Militärministeriums werden Einheiten des südlichen Militärbezirks, der Luftstreitkräfte und der Marine an den Übungen teilnehmen. Der Zweck der Übungen wird als Reaktion auf Provokationen und Bedrohungen durch westliche Länder bezeichnet. Das bedeutet, dass der südliche Militärbezirk, der ziemlich direkt an der Spezialoperation beteiligt ist, umfassende Übungen zum Einsatz taktischer Atomwaffen als Reaktion auf bestimmte Pläne westlicher Länder durchführen wird. Damit sind natürlich die kürzlich geäußerten Überlegungen zur Entsendung von NATO-Truppen in die Ukraine gemeint. Diese Aussage ist eine ernstzunehmende Steigerung sowohl dessen, was offiziell rhetorisch akzeptabel ist, als auch dessen, was bei den Übungen demonstriert wird. Ebenso wie das, was während dieser Übungen praktiziert wird. Quelle: 136 BRIGADE Abonniere: Übersicht Ukraine ©Ansichten der Kanalbetreiber" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Create prompt.txt
Browse files- prompt.txt +20 -0
prompt.txt
ADDED
|
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
Imagine that you are a journalist working for a fact-checking organization and you are looking for semantically identical copies of claim C. For two texts to be copies they can have a different wording and tonality but they cannot be about, for example, different entities or events. For the following texts T1 and T2 find the ones which are semantically identical to C and could be refuted with the same fact-checking article. Here is one example.
|
| 2 |
+
Input:
|
| 3 |
+
C: Geflüchtete müssten ihren Müll in Ludwigsburg in Baden-Württemberg nicht mehr trennen.
|
| 4 |
+
T1: Ludwigsburg ist gnadenlos in Sachen Mülltrennung. Wer falsch trennt, dem kann die Tonne gesperrt werden. Nur für Flüchtlinge macht die Politik jetzt eine Ausnahme: Vor Aufnahmelagern stehen nur noch Restmülltonnen, weil deren Bewohnern das Trennen nicht zuzumuten ist.
|
| 5 |
+
T2: In der Unterkunft in Grünbühl-Sonnenberg in Ludwigsburg ist nur die Biomülltonne durch eine Restmülltonne ersetzt worden. Es gab und gibt dort weiterhin verschiedene Wertstofftonnen.
|
| 6 |
+
JSON-Output:
|
| 7 |
+
{{"T1":True, "T2":False}}
|
| 8 |
+
Here is a second example
|
| 9 |
+
Input:
|
| 10 |
+
C: Zu einem Video über E-Fuels aus Freiberg heißt es, Deutschland lehne die Einführung von „Benzin aus CO2“ ab.
|
| 11 |
+
T1: E-Fuels werden in Deutschland mit Hilfe von Strom aus erneuerbaren Energien, Wasser und CO2 aus der Luft hergestellt und setzen damit im Gegensatz zu herkömmlichen Kraft- und Brennstoffen kein zusätzliches CO2 frei, sondern sind in der Gesamtbilanz CO2-neutral.
|
| 12 |
+
T2: Geniale Erfindung: Benzin aus CO2, Deutschland lehnt Einführung ab!
|
| 13 |
+
JSON-Output:
|
| 14 |
+
{{"T1":False, "T2":True}}
|
| 15 |
+
Now do it yourself for the following claim C. Your output must always be a JSON object with only 2 keys “T1” and “T2”, do not explain yourself or output anything else.
|
| 16 |
+
Input:
|
| 17 |
+
C: CLAIM_PLACEHOLDER
|
| 18 |
+
T1: POST_PLACEHOLDER1
|
| 19 |
+
T2: POST_PLACEHOLDER1
|
| 20 |
+
JSON-Output:
|