Spaces:

Effyis
/

AGDS-UI

Sleeping

App Files Files Community

Nechba commited on Jun 20, 2024

Commit

f31bfcd

1 Parent(s): 045c775

add txt file

Browse files

Files changed (2) hide show

app.py +44 -26
utlis/constant.py +1 -0

app.py CHANGED Viewed

@@ -33,7 +33,7 @@ with st.sidebar:
         if len(services)>0:
-            st.session_state.uploaded_files = st.file_uploader("Upload PDF file",  type=["pdf"], accept_multiple_files=False)
             if st.session_state.uploaded_files:
                 st.session_state.process = st.button('Process')
                 if st.session_state.process:
@@ -56,18 +56,22 @@ with st.sidebar:
             history_document =json.loads(history_document.text).get("documents",[])
             history_document = [doc["documentname"] for doc in history_document]
             st.session_state.doument_slected_to_chat = st.selectbox("Choose Documnet",history_document)
-            data = {"token": st.session_state.token, "service_name": st.session_state.service_slected_to_chat,"document_name":st.session_state.doument_slected_to_chat}
-            json_data = json.dumps(data)
-            headers = {'Content-Type': 'application/json'}
-            number_pages = requests.get(GET_NUM_PAGES,data=json_data, headers=headers)
-            number_pages =json.loads(number_pages.text).get("num_pages")
-            page_options = list(range(1, int(number_pages) + 1))
-            st.session_state.start_page = st.selectbox("Start Page",page_options)
-            st.session_state.end_page = st.selectbox("End Page", page_options, index=len(page_options) - 1)
-            st.session_state.method = st.selectbox("Chunking Method", ["chunk_per_page", "personalize_chunking"])
-            if st.session_state.method=="personalize_chunking":
-               st.session_state.split_token = st.text_area("Split Token")
         else:
             st.session_state.service_slected_to_chat = None
@@ -163,20 +167,34 @@ with st.container():
             keys = get_all_keys(schema)
             comments = handle_comments(keys)
         if schema and st.button('Process') :
-            data = {"token": st.session_state.token,
-            "service_name": st.session_state.service_slected_to_chat,
-            "document_name": st.session_state.doument_slected_to_chat,
-            "method": st.session_state.method,
-            "model": st.session_state.llm,
-            "schema": schema,
-            "comment": comments,
-            "split_token": st.session_state.split_token if st.session_state.method == "personalize_chunking" else "",
-            "start_page": st.session_state.start_page,
-            "end_page": st.session_state.end_page}
-            json_data = json.dumps(data)
-            headers = {'Content-Type': 'application/json'}
-            response  = requests.get(RESPONSE_API,data=json_data, headers=headers)
-            response_data = json.loads(response.text)
             if response_data.get('status')=='success':
                 json_str =response_data.get("json")
                 json_str_formatted = json.dumps(json_str)

         if len(services)>0:
+            st.session_state.uploaded_files = st.file_uploader("Upload PDF file",  type=["pdf","txt"], accept_multiple_files=False)
             if st.session_state.uploaded_files:
                 st.session_state.process = st.button('Process')
                 if st.session_state.process:
             history_document =json.loads(history_document.text).get("documents",[])
             history_document = [doc["documentname"] for doc in history_document]
             st.session_state.doument_slected_to_chat = st.selectbox("Choose Documnet",history_document)
+            if st.session_state.doument_slected_to_chat.split("_")[-1]=="pdf":
+                data = {"token": st.session_state.token, "service_name": st.session_state.service_slected_to_chat,"document_name":st.session_state.doument_slected_to_chat}
+                json_data = json.dumps(data)
+                headers = {'Content-Type': 'application/json'}
+                number_pages = requests.get(GET_NUM_PAGES,data=json_data, headers=headers)
+                number_pages =json.loads(number_pages.text).get("num_pages")
+                page_options = list(range(1, int(number_pages) + 1))
+                st.session_state.start_page = st.selectbox("Start Page",page_options)
+                st.session_state.end_page = st.selectbox("End Page", page_options, index=len(page_options) - 1)
+                st.session_state.method = st.selectbox("Chunking Method", ["chunk_per_page", "personalize_chunking"])
+                if st.session_state.method=="personalize_chunking":
+                    st.session_state.split_token = st.text_area("Split Token")
+            elif st.session_state.doument_slected_to_chat.split("_")[-1]=="txt":
+                st.session_state.method = st.selectbox("Chunking Method", ["personalize_chunking"])
+                st.session_state.split_token = st.text_area("Split Token")
         else:
             st.session_state.service_slected_to_chat = None
             keys = get_all_keys(schema)
             comments = handle_comments(keys)
         if schema and st.button('Process') :
+            if st.session_state.doument_slected_to_chat.split("_")[-1]=="pdf":
+                data = {"token": st.session_state.token,
+                "service_name": st.session_state.service_slected_to_chat,
+                "document_name": st.session_state.doument_slected_to_chat,
+                "method": st.session_state.method,
+                "model": st.session_state.llm,
+                "schema": schema,
+                "comment": comments,
+                "split_token": st.session_state.split_token if st.session_state.method == "personalize_chunking" else "",
+                "start_page": st.session_state.start_page,
+                "end_page": st.session_state.end_page}
+                json_data = json.dumps(data)
+                headers = {'Content-Type': 'application/json'}
+                response  = requests.get(RESPONSE_API,data=json_data, headers=headers)
+                response_data = json.loads(response.text)
+            elif st.session_state.doument_slected_to_chat.split("_")[-1]=="txt":
+                data = {"token": st.session_state.token,
+                "service_name": st.session_state.service_slected_to_chat,
+                "document_name": st.session_state.doument_slected_to_chat,
+                "method": st.session_state.method,
+                "model": st.session_state.llm,
+                "schema": schema,
+                "comment": comments,
+                "split_token": st.session_state.split_token}
+                json_data = json.dumps(data)
+                headers = {'Content-Type': 'application/json'}
+                response  = requests.get(RESPONSE_TXT_API,data=json_data, headers=headers)
+                response_data = json.loads(response.text)
             if response_data.get('status')=='success':
                 json_str =response_data.get("json")
                 json_str_formatted = json.dumps(json_str)

utlis/constant.py CHANGED Viewed

@@ -10,6 +10,7 @@ REMOVE_DOCUMENTS_API = IP_WEB_SERVER+"/remove_documents"
 REMOVE_SERVICE_API = IP_WEB_SERVER+"/remove_service"
 GET_NUM_PAGES = IP_WEB_SERVER+"/get_num_pages"
 RESPONSE_API = IP_WEB_SERVER+"/structure_response"
 DEFAULT_SCHEMA = {
     "GeographicContext": "<variable>",
     "SubGeographicContext": "<variable>",

 REMOVE_SERVICE_API = IP_WEB_SERVER+"/remove_service"
 GET_NUM_PAGES = IP_WEB_SERVER+"/get_num_pages"
 RESPONSE_API = IP_WEB_SERVER+"/structure_response"
+RESPONSE_TXT_API = IP_WEB_SERVER+"/structure_response_text"
 DEFAULT_SCHEMA = {
     "GeographicContext": "<variable>",
     "SubGeographicContext": "<variable>",