Spaces:

cjber
/

semantic-catalogue

Sleeping

cjber commited on Aug 9, 2024

Commit

2cdef68

1 Parent(s): 7116b5e

add alpha to hybrid search

Files changed (3) hide show

config/config.toml CHANGED Viewed

@@ -7,5 +7,6 @@ chunk_size = 1024
 chunk_overlap = 32
 [model]
-llm = "gpt-3.5-turbo"
 top_k = 100

 chunk_overlap = 32
 [model]
+llm = "gpt-4o-mini"
 top_k = 100
+alpha = 0.75

src/common/settings.py CHANGED Viewed

@@ -19,6 +19,7 @@ class DataStoreSettings(BaseSettings):
 class ModelSettings(BaseSettings):
     llm: str = Field(min_length=1)
     top_k: int = Field(gt=0, le=100)
 class Settings(BaseSettings):

 class ModelSettings(BaseSettings):
     llm: str = Field(min_length=1)
     top_k: int = Field(gt=0, le=100)
+    alpha: float = Field(ge=0.0, le=1.0)
 class Settings(BaseSettings):

src/model/model.py CHANGED Viewed

@@ -1,10 +1,8 @@
 from typing import TypedDict
 from dotenv import load_dotenv
-from langchain.retrievers import (
-    ContextualCompressionRetriever,
-    PineconeHybridSearchRetriever,
-)
 # from langchain.retrievers.document_compressors import FlashrankRerank
 from langchain_core.documents import Document
@@ -60,13 +58,13 @@ def create_retriever():
     pc = Pinecone()
     index = pc.Index(cfg.datastore.index_name, host=cfg.datastore.host)
     embeddings = OpenAIEmbeddings(model=cfg.datastore.embed_model)
-    retriever = PineconeHybridSearchRetriever(
         embeddings=embeddings,
         sparse_encoder=bm25_encoder,
         index=index,
         top_k=cfg.model.top_k,
     )
-    return retriever
 def retrieve(state, retriever):

 from typing import TypedDict
 from dotenv import load_dotenv
+from langchain.retrievers import ContextualCompressionRetriever
+from langchain_community.retrievers import PineconeHybridSearchRetriever
 # from langchain.retrievers.document_compressors import FlashrankRerank
 from langchain_core.documents import Document
     pc = Pinecone()
     index = pc.Index(cfg.datastore.index_name, host=cfg.datastore.host)
     embeddings = OpenAIEmbeddings(model=cfg.datastore.embed_model)
+    return PineconeHybridSearchRetriever(
         embeddings=embeddings,
         sparse_encoder=bm25_encoder,
         index=index,
         top_k=cfg.model.top_k,
+        alpha=cfg.model.alpha,
     )
 def retrieve(state, retriever):