BabyWriter7

Sleeping

Yasu777 commited on Jan 29, 2024

Commit

3cfefb9

verified ·

1 Parent(s): 621abfa

Update first.py

Files changed (1) hide show

first.py CHANGED Viewed

@@ -72,8 +72,8 @@ def extract_text_from_url(url, output_file):
         p_tags = soup.find_all("p")
         output_text = ""
         for p in p_tags:
-            if len(output_text) + len(p.get_text()) > 5000:
-                break  # 5000文字を超えたらループを終了
             output_text += p.get_text()
         output_text = output_text.replace("\n", "")
         output_text = output_text.replace('\xa0', ' ')

         p_tags = soup.find_all("p")
         output_text = ""
         for p in p_tags:
+            if len(output_text) + len(p.get_text()) > 7500:
+                break  # 7500文字を超えたらループを終了
             output_text += p.get_text()
         output_text = output_text.replace("\n", "")
         output_text = output_text.replace('\xa0', ' ')