Spaces:

alexkueck
/

TestInferenceAPI

Running

App Files Files Community

alexkueck commited on Dec 17, 2023

Commit

f981623

1 Parent(s): 670e2d1

Update app.py

Browse files

Files changed (1) hide show

app.py +0 -27

app.py CHANGED Viewed

@@ -14,18 +14,13 @@ from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLo
 from langchain.document_loaders.generic import GenericLoader
 from langchain.document_loaders.parsers import OpenAIWhisperParser
 from langchain.schema import AIMessage, HumanMessage
-from langchain.llms import HuggingFaceHub
-from langchain.llms import HuggingFaceTextGenInference
 from langchain.embeddings import HuggingFaceInstructEmbeddings, HuggingFaceEmbeddings, HuggingFaceBgeEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain.embeddings.openai import OpenAIEmbeddings
-from langchain.prompts import PromptTemplate
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.vectorstores import Chroma
 from chromadb.errors import InvalidDimensionException
-#from langchain.vectorstores import MongoDBAtlasVectorSearch
-#from pymongo import MongoClient
 from dotenv import load_dotenv, find_dotenv
 _ = load_dotenv(find_dotenv())
@@ -44,14 +39,6 @@ template = """Antworte in deutsch, wenn es nicht explizit anders gefordert wird.
 llm_template = "Beantworte die Frage am Ende. " + template + "Frage: {question} Hilfreiche Antwort: "
 rag_template = "Nutze die folgenden Kontext Teile, um die Frage zu beantworten am Ende. " + template + "{context} Frage: {question} Hilfreiche Antwort: "
-#################################################
-#Prompts - Zusammensetzung
-#################################################
-LLM_CHAIN_PROMPT = PromptTemplate(input_variables = ["question"],
-                                  template = llm_template)
-#mit RAG
-RAG_CHAIN_PROMPT = PromptTemplate(input_variables = ["context", "question"],
-                                  template = rag_template)
 #################################################
 # Konstanten
@@ -170,12 +157,6 @@ def document_storage_chroma(splits):
     #HF embeddings--------------------------------------
     #Chroma.from_documents(documents = splits, embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2", model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False}),  persist_directory = PATH_WORK + CHROMA_DIR)
-#Mongo DB die splits ablegen - vektorisiert...
-def document_storage_mongodb(splits):
-    MongoDBAtlasVectorSearch.from_documents(documents = splits,
-                                            embedding = OpenAIEmbeddings(disallowed_special = ()),
-                                            collection = MONGODB_COLLECTION,
-                                            index_name = MONGODB_INDEX_NAME)
 #Vektorstore vorbereiten...
 #dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur
@@ -193,14 +174,6 @@ def document_retrieval_chroma(llm, prompt):
     db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
     return db
-#dokumente in mongo db vektorisiert ablegen können - die Db vorbereiten daüfür
-def document_retrieval_mongodb(llm, prompt):
-    db = MongoDBAtlasVectorSearch.from_connection_string(MONGODB_URI,
-                                                         MONGODB_DB_NAME + "." + MONGODB_COLLECTION_NAME,
-                                                         OpenAIEmbeddings(disallowed_special = ()),
-                                                         index_name = MONGODB_INDEX_NAME)
-    return db
 ###############################################
 #Langchain anlegen

 from langchain.document_loaders.generic import GenericLoader
 from langchain.document_loaders.parsers import OpenAIWhisperParser
 from langchain.schema import AIMessage, HumanMessage
 from langchain.embeddings import HuggingFaceInstructEmbeddings, HuggingFaceEmbeddings, HuggingFaceBgeEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.vectorstores import Chroma
 from chromadb.errors import InvalidDimensionException
 from dotenv import load_dotenv, find_dotenv
 _ = load_dotenv(find_dotenv())
 llm_template = "Beantworte die Frage am Ende. " + template + "Frage: {question} Hilfreiche Antwort: "
 rag_template = "Nutze die folgenden Kontext Teile, um die Frage zu beantworten am Ende. " + template + "{context} Frage: {question} Hilfreiche Antwort: "
 #################################################
 # Konstanten
     #HF embeddings--------------------------------------
     #Chroma.from_documents(documents = splits, embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2", model_kwargs={"device": "cpu"}, encode_kwargs={'normalize_embeddings': False}),  persist_directory = PATH_WORK + CHROMA_DIR)
 #Vektorstore vorbereiten...
 #dokumente in chroma db vektorisiert ablegen können - die Db vorbereiten daüfur
     db = Chroma(embedding_function = embeddings, persist_directory = PATH_WORK + CHROMA_DIR)
     return db
 ###############################################
 #Langchain anlegen