SituatedEmbedding
/

SitEmb-v1.5-Qwen3

Sentence Similarity

Model card Files Files and versions

SituatedEmbedding commited on Aug 4, 2025

Commit

bcd944b

·

verified ·

1 Parent(s): 229d86a

Update README.md

Files changed (1) hide show

README.md +9 -1

README.md CHANGED Viewed

@@ -12,6 +12,9 @@ The model of SitEmb-v1.5-Qwen3.
 import torch
 from transformers import AutoTokenizer, AutoModel
 residual = True
 residual_factor = 0.5
@@ -122,8 +125,13 @@ query_hidden, _ = encode_query(
     tokenizer, model, pooling_type="eos", queries=["Your query"],
     batch_size=8, normalize=True, max_length=8192, residual=residual,
 )
 candidate_hidden, candidate_hidden_residual = encode_passage(
-    tokenizer, model, pooling_type="eos", passages=["Your chunk<|endoftext|>Your context"],
     batch_size=4, normalize=True, max_length=8192, residual=residual,
 )

 import torch
 from transformers import AutoTokenizer, AutoModel
+from tqdm import tqdm
+from more_itertools import chunked
 residual = True
 residual_factor = 0.5
     tokenizer, model, pooling_type="eos", queries=["Your query"],
     batch_size=8, normalize=True, max_length=8192, residual=residual,
 )
+passage_affix = "The context in which the chunk is situated is given below. Please encode the chunk by being aware of the context. Context:\n"
+your_chunk = "Your Chunk"
+your_context = "Your Context"
 candidate_hidden, candidate_hidden_residual = encode_passage(
+    tokenizer, model, pooling_type="eos", passages=[f"{your_chunk}<|endoftext|>{passage_affix}{your_context}"],
     batch_size=4, normalize=True, max_length=8192, residual=residual,
 )