Spaces:

ZORYE
/

CPS

Sleeping

App Files Files Community

ZORYE commited on Apr 27, 2025

Commit

0d2efcb

verified ·

1 Parent(s): 74a9056

Update app.py

Browse files

Files changed (1) hide show

app.py +130 -0

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ from rembg import remove
 from PIL import Image, ImageDraw, ImageFont
 import io
 import gradio as gr
 # ▼ 기본 다운로드 폴더
 DEFAULT_DOWNLOAD_DIR = "./downloads"
@@ -46,6 +47,135 @@ def add_watermark(image, text="gooditem gooditem gooditem gooditem gooditem"):
     return combined
 def extract_info_block(article_text):
     pattern = r'(KBS2.*?<모델명>.*?)(?:\n\n|$)'
     match = re.search(pattern, article_text, re.DOTALL)

 from PIL import Image, ImageDraw, ImageFont
 import io
 import gradio as gr
+import shutil
 # ▼ 기본 다운로드 폴더
 DEFAULT_DOWNLOAD_DIR = "./downloads"
     return combined
+def extract_info_block(article_text): pattern = r'(KBS2.?<모델명>.?)(?:\n\n|$)' match = re.search(pattern, article_text, re.DOTALL)
+if match:
+    return match.group(1).strip()
+else:
+    return None
+#제품명 추출 함수 수정 (여러 모델명 처리)
+def extract_product_info(article_text): brand_match = re.search(r'<브랜드>[ \t]*([^\n]+)', article_text) brand = brand_match.group(1).strip() if brand_match else None
+model_matches = re.findall(r'<모델명>[ \t]*([^\n]+)', article_text)
+result = []
+if brand and model_matches:
+    brand_words = re.findall(r'[A-Za-z]+', brand)
+    selected_brand = ' '.join(brand_words[:2])
+    for model in model_matches:
+        model = model.strip()
+        search_query = f"{selected_brand} {model}"
+        search_url = f"https://www.coupang.com/np/search?component=&q={search_query.replace(' ', '+')}"
+        result.append((model, search_url))
+return result
+#process_url 함수 수정 (모델명 여러개 대응, 이미지 경로 반환)
+def process_url(tistory_url, output_dir): result = [] image_paths = [] try: response = requests.get(tistory_url) soup = BeautifulSoup(response.text, 'html.parser')
+img_tags = soup.find_all('img')
+    img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
+    # 이미지 처리
+    for idx, img_url in enumerate(img_urls):
+        base_name = os.path.basename(img_url).split('?')[0]
+        if base_name.startswith('new_ico'):
+            continue
+        img_data = requests.get(img_url).content
+        input_img = Image.open(io.BytesIO(img_data)).convert('RGBA')
+        input_bytes = io.BytesIO()
+        input_img.save(input_bytes, format='PNG')
+        removed = remove(input_bytes.getvalue())
+        img_no_bg = Image.open(io.BytesIO(removed)).convert('RGBA')
+        final_img = add_watermark(img_no_bg)
+        os.makedirs(output_dir, exist_ok=True)
+        name, ext = os.path.splitext(base_name)
+        save_path = os.path.join(output_dir, f"{name}_{idx+1}_processed.png")
+        final_img.save(save_path)
+        result.append(f"✔️ 저장 완료: {save_path}")
+        image_paths.append(save_path)
+    # 텍스트 추출
+    article_text = soup.get_text()
+    # 프로그램 정보 블록 추출
+    info_block = extract_info_block(article_text)
+    # 제품 정보 추출 (여러 모델명 처리)
+    item_info_list = extract_product_info(article_text)
+    # 정리된 출력 포맷
+    if info_block:
+        result.append("\n===== 프로그램 정보 블록 =====")
+        result.append(info_block)
+        result.append("================================\n")
+    for model_name, search_url in item_info_list:
+        result.append(f"🛍️ 아이템 : {model_name}")
+        result.append(f"🔗 쿠팡 링크: {search_url}")
+except Exception as e:
+    result.append(f"❌ URL 처리 실패: {tistory_url} / 에러: {e}")
+return result, image_paths
+#여러 URL 처리 및 파일 저장
+def process_multiple_urls(urls_text, output_dir): urls = [url.strip() for url in urls_text.strip().splitlines() if url.strip()] all_results = [] all_images = []
+for url in urls:
+    results, image_paths = process_url(url, output_dir)
+    all_results.extend(results)
+    all_images.extend(image_paths)
+    all_results.append("-" * 50)
+final_text = "\n".join(all_results)
+# 결과 저장
+os.makedirs(output_dir, exist_ok=True)
+result_file_path = os.path.join(output_dir, "result_log.txt")
+with open(result_file_path, 'w', encoding='utf-8-sig') as f:
+    f.write(final_text)
+return final_text, result_file_path, all_images
+Gradio 앱 구성
+with gr.Blocks() as app: gr.Markdown("# ✨ 티스토리 자동 처리기 ✨\n- 이미지 배경 제거 + 워터마크 삽입\n- 제품명 추출 후 쿠팡 검색 링크 생성\n- 다운로드 기능 추가!")
+with gr.Row():
+    urls_input = gr.Textbox(label="티스토리 게시글 URL 여러 개 (줄바꿈해서 입력)", lines=5, placeholder="https://example1.com\nhttps://example2.com")
+with gr.Row():
+    output_folder = gr.Textbox(label="저장할 폴더 경로", value=DEFAULT_DOWNLOAD_DIR)
+process_button = gr.Button("처리 시작 🚀")
+output_text = gr.Textbox(label="결과", lines=20)
+download_log = gr.File(label="결과 로그 다운로드")
+download_images = gr.File(label="다운로드한 이미지들", file_types=['.png'], interactive=True, multiple=True)
+process_button.click(
+    fn=process_multiple_urls,
+    inputs=[urls_input, output_folder],
+    outputs=[output_text, download_log, download_images]
+)
+app.launch()
 def extract_info_block(article_text):
     pattern = r'(KBS2.*?<모델명>.*?)(?:\n\n|$)'
     match = re.search(pattern, article_text, re.DOTALL)