Spaces:

kdevoe
/

ResolveAI

Sleeping

kdevoe commited on Apr 11, 2025

Commit

e13dd34

verified ·

1 Parent(s): 4fb848b

Trying cache resource on vectordb build

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,12 +17,6 @@ from sklearn.model_selection import train_test_split
 # # Download dataset
 file_path = "dataset-tickets-multi-lang-4-20k.csv"
-# # Load the latest version
-# df = kagglehub.load_dataset(
-#   KaggleDatasetAdapter.PANDAS,
-#   "tobiasbueck/multilingual-customer-support-tickets",
-#   file_path,
-# )
 df = pd.read_csv(file_path)
@@ -47,13 +41,23 @@ documents = loader.load()
 # Get OpenAI setup
 openai_api_key = os.getenv("openai_token")
-embedding = OpenAIEmbeddings(openai_api_key=openai_api_key)
-vectordb = Chroma.from_documents(
-    documents=documents,
-    embedding=embedding,
-    persist_directory=persist_directory
-)
 # @st.cache_resource
 # def get_vectordb():

 # # Download dataset
 file_path = "dataset-tickets-multi-lang-4-20k.csv"
 df = pd.read_csv(file_path)
 # Get OpenAI setup
 openai_api_key = os.getenv("openai_token")
+# embedding = OpenAIEmbeddings(openai_api_key=openai_api_key)
+# vectordb = Chroma.from_documents(
+#     documents=documents,
+#     embedding=embedding,
+#     persist_directory=persist_directory
+# )
+@st.cache_resource
+def get_vectordb():
+    embedding = OpenAIEmbeddings(openai_api_key=os.getenv("openai_token"))
+    return Chroma.from_documents(
+        documents=documents,
+        embedding=embedding,
+        persist_directory=persist_directory)
+vectordb = get_vectordb()
 # @st.cache_resource
 # def get_vectordb():