Spaces:

tollefj
/

siktsok

Build error

App Files Files Community

tollefj commited on Feb 10, 2025

Commit

acc49a5

1 Parent(s): d45f5b7

v2

Browse files

Files changed (5) hide show

.gitignore +1 -0
app.py +36 -16
faiss.lookup.csv +0 -0
faiss.index.zip → files.zip +2 -2
prep.py +5 -2

.gitignore CHANGED Viewed

	@@ -1 +1,2 @@
1	*.index


1	*.index
2	+ *.csv

app.py CHANGED Viewed

@@ -1,16 +1,22 @@
 import faiss
 import gradio as gr
 import numpy as np
 import pandas as pd
 from sentence_transformers import SentenceTransformer
 import zipfile
-index_file = "faiss.index.zip"
-with zipfile.ZipFile(index_file, "r") as z:
     z.extractall()
 pr_number = 14
 model = SentenceTransformer(
     "intfloat/multilingual-e5-small",
     revision=f"refs/pr/{pr_number}",
@@ -36,7 +42,7 @@ class FaissIndex:
     def extract_docs(self, indices, k):
         indices = list(indices[0])
         lookup = self.df.iloc[indices]
-        questions = lookup["question"].values
         answers = lookup["answer"].values
         pairs = list(zip(questions, answers))
@@ -51,7 +57,7 @@ class FaissIndex:
         # format pairs as: f"{answer}\n{kilde: {question}}"
         formatted_pairs = []
         for pair in filtered_pairs:
-            formatted_pairs.append(f"{pair[1]} (kilde: {pair[0]})")
         return formatted_pairs
     def search(self, query: str, k: int = 5):
@@ -62,10 +68,13 @@ class FaissIndex:
         return self.extract_docs(indices, k)
 index = FaissIndex(model)
 def query_faiss_index(søketekst):
     """
     Queries the FAISS index with the provided search text and returns the top 5 results.
     Args:
@@ -74,20 +83,31 @@ def query_faiss_index(søketekst):
         str: A string containing the top 5 search results, separated by double newlines.
     """
-    results = index.search(søketekst, k=5)
     return "\n\n".join(results)
 # Create the Gradio interface
-iface = gr.Interface(
-    fn=query_faiss_index,
-    inputs=gr.Textbox(lines=2, placeholder="Søk etter info i SIKT", interactive=True),
-    outputs=gr.Textbox(label="Søkeresultater", type="text", lines=15),
-    title="SIKT-FAQ",
-    description="Semantisk søk i SIKT med Openvino.",
-    live=True
-)
 # Launch the Gradio app
-if __name__ == "__main__":
-    iface.launch()

 import faiss
 import gradio as gr
 import numpy as np
 import pandas as pd
 from sentence_transformers import SentenceTransformer
 import zipfile
+import os
+import logging
+logging.basicConfig(level=logging.ERROR)
+# if not os.path.exists("faiss.index"):
+with zipfile.ZipFile("files.zip", "r") as z:
     z.extractall()
 pr_number = 14
+logging.info("Loading embedding model")
 model = SentenceTransformer(
     "intfloat/multilingual-e5-small",
     revision=f"refs/pr/{pr_number}",
     def extract_docs(self, indices, k):
         indices = list(indices[0])
         lookup = self.df.iloc[indices]
+        questions = lookup["query"].values
         answers = lookup["answer"].values
         pairs = list(zip(questions, answers))
         # format pairs as: f"{answer}\n{kilde: {question}}"
         formatted_pairs = []
         for pair in filtered_pairs:
+            formatted_pairs.append(f"{pair[1]}")
         return formatted_pairs
     def search(self, query: str, k: int = 5):
         return self.extract_docs(indices, k)
+logging.info("Loading FAISS index")
 index = FaissIndex(model)
 def query_faiss_index(søketekst):
+    if len(søketekst) < 3:
+        return
     """
     Queries the FAISS index with the provided search text and returns the top 5 results.
     Args:
         str: A string containing the top 5 search results, separated by double newlines.
     """
+    results = index.search(søketekst, k=3)
     return "\n\n".join(results)
 # Create the Gradio interface
+# iface = gr.Interface(
+#     fn=query_faiss_index,
+#     inputs=gr.Textbox(lines=2, placeholder="Søk etter info i SIKT", interactive=True, min_width="30vw"),
+#     outputs=gr.Textbox(label="Søkeresultater", type="text", lines=20, min_width="70vw"),
+#     title="SIKT-FAQ",
+#     description="Semantisk søk i SIKT med Openvino.",
+#     live=True
+# )
+with gr.Blocks() as blocks:
+    gr.Markdown("## SIKT-FAQ")
+    with gr.Row():
+        box_search = gr.Textbox(label="Søk etter informasjon i SIKT", lines=1, placeholder="Innlogging i FEIDE...", interactive=True)
+    with gr.Row():
+        box_output = gr.Textbox(label="Søkeresultater", type="text", lines=20)
+    box_search.change(fn=query_faiss_index, inputs=box_search, outputs=box_output, max_batch_size=1)
+blocks.launch()
 # Launch the Gradio app
+# if __name__ == "__main__":
+#     iface.launch()

faiss.lookup.csv DELETED Viewed

The diff for this file is too large to render. See raw diff

faiss.index.zip → files.zip RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a85d3ff0d5a335201c3b92fb3466df469c4f3fb9569a087166d393ca7801527e
-size 6895269

 version https://git-lfs.github.com/spec/v1
+oid sha256:8739c76e681f900923b900c9df0ef75cf421d39cabb54650c4b9ad19b6a76d85
+size 22

prep.py CHANGED Viewed

@@ -1,5 +1,8 @@
 import zipfile
 index_file = "faiss.index"
-with zipfile.ZipFile(index_file + ".zip", "w") as z:
-    z.write(index_file)

 import zipfile
 index_file = "faiss.index"
+lookup_file = "faiss.lookup.csv"
+with zipfile.ZipFile("files.zip", "w") as z:
+    z.write(index_file)
+    z.write(lookup_file)