devdefalut20
/

Multilingual_Semantic_Similarity

Sentence Similarity

Model card Files Files and versions

devdefalut20 commited on Sep 30, 2024

Commit

fd7ab08

·

verified ·

1 Parent(s): aadbfaa

Create app.py

Files changed (1) hide show

app.py +32 -0

app.py ADDED Viewed

	@@ -0,0 +1,32 @@

+import torch
+from transformers import AutoTokenizer, AutoModel
+from torch.nn.functional import cosine_similarity
+import gradio as gr
+model_name = 'bert-base-multilingual-cased'
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModel.from_pretrained(model_name)
+# Function to compute embeddings
+def compute_embedding(text):
+    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+    with torch.no_grad():
+        outputs = model(**inputs)
+        embedding = outputs.last_hidden_state.mean(dim=1)
+    return embedding
+# Function to compute similarity between two sentences
+def compare_sentences(text1, text2):
+    embedding1 = compute_embedding(text1)
+    embedding2 = compute_embedding(text2)
+    similarity_score = cosine_similarity(embedding1, embedding2).item()
+    return f"Similarity Score: {similarity_score:.4f}"
+# Gradio interface for input
+iface = gr.Interface(fn=compare_sentences,
+                     inputs=["text", "text"],
+                     outputs="text",
+                     title="Sentence Similarity",
+                     description="Enter two sentences to compute their similarity.")
+iface.launch()