URL2Text2

Sleeping

tregu0458 commited on Jun 22, 2024

Commit

eb8dde2

verified ·

1 Parent(s): d0a97bd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ async def validate_token(token: str = Depends(oauth2_scheme)):
         raise HTTPException(status_code=401, detail="Invalid API Key")
 @app.post("/extract_text", tags=["Text Extraction"], dependencies=[Depends(validate_token)])
-def extract_text(url: str, language: str = "ja", length: int = 150000,jina:bool = true):
     try:
         if "youtube.com" in url or "youtu.be" in url:
             # YouTubeの場合
@@ -38,9 +38,9 @@ def extract_text(url: str, language: str = "ja", length: int = 150000,jina:bool
             # loader = WebBaseLoader(url)
             # docs = loader.load()
             # text_content = docs[0].page_content
-            if jina:
                 response = requests.get("https://r.jina.ai/"+ url)
-                return response.text
             else:
                 text_content = str(fetch_and_convert_to_markdown(url))

         raise HTTPException(status_code=401, detail="Invalid API Key")
 @app.post("/extract_text", tags=["Text Extraction"], dependencies=[Depends(validate_token)])
+def extract_text(url: str, language: str = "ja", length: int = 150000,use_jina:bool = True):
     try:
         if "youtube.com" in url or "youtu.be" in url:
             # YouTubeの場合
             # loader = WebBaseLoader(url)
             # docs = loader.load()
             # text_content = docs[0].page_content
+            if use_jina:
                 response = requests.get("https://r.jina.ai/"+ url)
+                text_content = response.text
             else:
                 text_content = str(fetch_and_convert_to_markdown(url))