URL2Text2

Build error

tregu0458 commited on May 13, 2024

Commit

09e6384

verified ·

1 Parent(s): 187a6e9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,4 @@
 import os
-import tempfile
 import requests
 from fastapi import FastAPI, HTTPException
 from langchain.document_loaders import YoutubeLoader, UnstructuredPDFLoader, WebBaseLoader
@@ -21,13 +20,12 @@ def extract_text(url: str, language: str = "ja", length: int = 150000):
         elif url.endswith(".pdf"):
             # PDFの場合
             response = requests.get(url)
-            with tempfile.NamedTemporaryFile(delete=False) as temp_file:
-                temp_file.write(response.content)
-                temp_file_path = temp_file.name
-            loader = UnstructuredPDFLoader(temp_file_path)
             docs = loader.load()
             text_content = docs[0].page_content
-            os.unlink(temp_file_path)  # 一時ファイルを削除
         else:
             # それ以外の場合
             loader = WebBaseLoader(url)

 import os
 import requests
 from fastapi import FastAPI, HTTPException
 from langchain.document_loaders import YoutubeLoader, UnstructuredPDFLoader, WebBaseLoader
         elif url.endswith(".pdf"):
             # PDFの場合
             response = requests.get(url)
+            pdf_file_path = os.path.join("/app/downloads", os.path.basename(url))
+            with open(pdf_file_path, "wb") as pdf_file:
+                pdf_file.write(response.content)
+            loader = UnstructuredPDFLoader(pdf_file_path)
             docs = loader.load()
             text_content = docs[0].page_content
         else:
             # それ以外の場合
             loader = WebBaseLoader(url)