URL2Text2

Sleeping

tregu0458 commited on May 13, 2024

Commit

6ef3c36

verified ·

1 Parent(s): 8087eb1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,12 +1,21 @@
 import os
 import requests
-from fastapi import FastAPI, HTTPException
 from langchain_community.document_loaders import YoutubeLoader, UnstructuredPDFLoader, WebBaseLoader
 from langchain_community.document_loaders import OnlinePDFLoader
 app = FastAPI()
-@app.post("/extract_text", tags=["Text Extraction"])
 def extract_text(url: str, language: str = "ja", length: int = 150000):
     try:
         if "youtube.com" in url or "youtu.be" in url:
@@ -20,15 +29,9 @@ def extract_text(url: str, language: str = "ja", length: int = 150000):
             text_content = str(docs)
         elif url.endswith(".pdf"):
             # PDFの場合
-            # response = requests.get(url)
-            # pdf_file_path = os.path.join("/app/downloads", os.path.basename(url))
-            # with open(pdf_file_path, "wb") as pdf_file:
-                # pdf_file.write(response.content)
-            # loader = UnstructuredPDFLoader(pdf_file_path)
             loader = OnlinePDFLoader(url)
             docs = loader.load()
             text_content = docs[0].page_content
-            # text_content = pdf_file_path
         else:
             # それ以外の場合
             loader = WebBaseLoader(url)

 import os
 import requests
+from fastapi import FastAPI, HTTPException, Depends
+from fastapi.security import OAuth2PasswordBearer
 from langchain_community.document_loaders import YoutubeLoader, UnstructuredPDFLoader, WebBaseLoader
 from langchain_community.document_loaders import OnlinePDFLoader
 app = FastAPI()
+API_KEY = "your-secret-api-key"
+oauth2_scheme = OAuth2PasswordBearer(tokenUrl="token")
+async def validate_token(token: str = Depends(oauth2_scheme)):
+    if token != API_KEY:
+        raise HTTPException(status_code=401, detail="Invalid API Key")
+@app.post("/extract_text", tags=["Text Extraction"], dependencies=[Depends(validate_token)])
 def extract_text(url: str, language: str = "ja", length: int = 150000):
     try:
         if "youtube.com" in url or "youtu.be" in url:
             text_content = str(docs)
         elif url.endswith(".pdf"):
             # PDFの場合
             loader = OnlinePDFLoader(url)
             docs = loader.load()
             text_content = docs[0].page_content
         else:
             # それ以外の場合
             loader = WebBaseLoader(url)