Shuu12121
/

CodeCloneDetection-ModernBERT-Owl

Sentence Similarity

sentence-transformers

dataset_size:901028

loss:CosineSimilarityLoss

Eval Results (legacy)

text-embeddings-inference

Model card Files Files and versions

Shuu12121 commited on Apr 3, 2025

Commit

edf421e

·

verified ·

1 Parent(s): a0b6b34

Update README.md

Files changed (1) hide show

README.md +19 -10

README.md CHANGED Viewed

@@ -82,19 +82,28 @@ This model is a SentenceTransformer fine-tuned from [`Shuu12121/CodeModernBERT-O
 ```python
 from sentence_transformers import SentenceTransformer
-model = SentenceTransformer("your-model-id")
-sentences = [
-    "def add(a, b): return a + b",
-    "def sum(x, y): return x + y"
-]
-embeddings = model.encode(sentences)
 from torch.nn.functional import cosine_similarity
 import torch
-score = cosine_similarity(torch.tensor([embeddings[0]]), torch.tensor([embeddings[1]]))
-print(f"Cosine similarity: {score.item():.4f}")
 ```
 ---

 ```python
 from sentence_transformers import SentenceTransformer
 from torch.nn.functional import cosine_similarity
 import torch
+# Load the fine-tuned model
+model = SentenceTransformer("Shuu12121/CodeCloneDetection-ModernBERT-Owl")
+# Two code snippets to compare
+code1 = "def add(a, b): return a + b"
+code2 = "def sum(x, y): return x + y"
+# Encode the code snippets
+embeddings = model.encode([code1, code2], convert_to_tensor=True)
+# Compute cosine similarity
+similarity_score = cosine_similarity(embeddings[0].unsqueeze(0), embeddings[1].unsqueeze(0)).item()
+# Print the result
+print(f"Cosine Similarity: {similarity_score:.4f}")
+if similarity_score >= 0.5:
+    print("🟢 These code snippets are considered CLONES.")
+else:
+    print("🔴 These code snippets are NOT considered clones.")
 ```
 ---