MeasurementTesting

Sleeping

App Files Files Community

Marthee commited on Oct 22, 2024

Commit

c1d20df

verified ·

1 Parent(s): 78cfd9e

Update tsadropboxretrieval.py

Browse files

Files changed (1) hide show

tsadropboxretrieval.py +27 -6

tsadropboxretrieval.py CHANGED Viewed

@@ -193,6 +193,25 @@ def getPathtoPDF_File(nameofPDF):
   return path,link
 # parquetDf
 # getPathtoPDF_File('A5157-EBLA-V5-XX-SH-L-0004-D2-01.pdf')
 def getPDFData(path):
   dbxTeam= ADR_Access_DropboxTeam('admin')
@@ -201,23 +220,25 @@ def getPDFData(path):
   return data
 def retrieveProjects(projname):
   projname='/'+projname.split(' ')[0]
   parquetDf=GetParquetDF()
   documentsToMeasure = []
   RelevantDocuments = []
-  projnameWithDetails = f'{projname} 01 Project Details'
   parquetDf['path_display_lower'] = parquetDf['path_display'].str.lower()
   # Filter based on the presence of '/2221' and '01 Project Details'
   mask = parquetDf['path_display_lower'].apply(lambda x: projname in x and '01 project details' in x)
   # Filter RelevantDocuments and documentsToMeasure using the mask
-  RelevantDocuments = parquetDf[mask][['name', 'path_display']].values.tolist()
   documentsToMeasure = [doc for doc in RelevantDocuments if doc[0].endswith('.pdf')] # Filter documentsToMeasure for PDF files later if needed
   # Remove the temporary 'path_display_lower' column
   parquetDf.drop(columns=['path_display_lower'], inplace=True)
   return documentsToMeasure,RelevantDocuments

   return path,link
 # parquetDf
+# getPathtoPDF_File('A5157-EBLA-V5-XX-SH-L-0004-D2-01.pdf')
+def getPDFData(path):
+  dbxTeam= ADR_Access_DropboxTeam('admin')
+  md, res =dbxTeam.files_download(path)
+  data = res.content
+  return data
+def getPathtoPDF_File(nameofPDF):
+  parquetDf=GetParquetDF()
+  nameofPDF=nameofPDF.replace('"', '')
+  try:
+    path=parquetDf.loc[parquetDf['name'] == nameofPDF, 'path_display'].iloc[0]
+    link=getSharedLink(path)
+    print(path,link)
+  except:
+    return 'Project does not exist'
+  return path,link
+# parquetDf
 # getPathtoPDF_File('A5157-EBLA-V5-XX-SH-L-0004-D2-01.pdf')
 def getPDFData(path):
   dbxTeam= ADR_Access_DropboxTeam('admin')
   return data
 def retrieveProjects(projname):
+  print('retrieve',projname)
   projname='/'+projname.split(' ')[0]
+  projname=projname.replace('/"', '')
+  print(projname)
   parquetDf=GetParquetDF()
   documentsToMeasure = []
   RelevantDocuments = []
   parquetDf['path_display_lower'] = parquetDf['path_display'].str.lower()
   # Filter based on the presence of '/2221' and '01 Project Details'
   mask = parquetDf['path_display_lower'].apply(lambda x: projname in x and '01 project details' in x)
+  print(mask)
   # Filter RelevantDocuments and documentsToMeasure using the mask
+  RelevantDocuments = parquetDf[mask][['name', 'path_display_lower']].values.tolist()
   documentsToMeasure = [doc for doc in RelevantDocuments if doc[0].endswith('.pdf')] # Filter documentsToMeasure for PDF files later if needed
+  print(documentsToMeasure)
   # Remove the temporary 'path_display_lower' column
   parquetDf.drop(columns=['path_display_lower'], inplace=True)
+  print(len(documentsToMeasure))
   return documentsToMeasure,RelevantDocuments