Spaces:
Build error
Build error
Update app.py
Browse files
app.py
CHANGED
|
@@ -4,6 +4,11 @@ import gradio as gr
|
|
| 4 |
import openpyxl
|
| 5 |
from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
|
| 6 |
import os # 경로 확인 및 생성용
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 7 |
|
| 8 |
def extract_keywords(file):
|
| 9 |
# 엑셀 파일 읽기
|
|
@@ -19,7 +24,8 @@ def extract_keywords(file):
|
|
| 19 |
|
| 20 |
for name in product_names:
|
| 21 |
if pd.notna(name): # NaN 값 체크
|
| 22 |
-
|
|
|
|
| 23 |
keywords.extend(words)
|
| 24 |
|
| 25 |
# 키워드 빈도수 계산
|
|
@@ -41,7 +47,8 @@ def extract_keywords(file):
|
|
| 41 |
|
| 42 |
# 새로운 엑셀 파일 생성 및 이미지 삽입
|
| 43 |
with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
|
| 44 |
-
|
|
|
|
| 45 |
workbook = writer.book
|
| 46 |
worksheet = workbook.active
|
| 47 |
|
|
|
|
| 4 |
import openpyxl
|
| 5 |
from openpyxl.drawing.image import Image # 이미지 삽입을 위한 모듈
|
| 6 |
import os # 경로 확인 및 생성용
|
| 7 |
+
import re # 특수문자 제거를 위한 정규식 사용
|
| 8 |
+
|
| 9 |
+
def clean_text(text):
|
| 10 |
+
# 정규식을 사용하여 특수문자를 제거하되, '-'는 제외
|
| 11 |
+
return re.sub(r'[^\w\s-]', '', text)
|
| 12 |
|
| 13 |
def extract_keywords(file):
|
| 14 |
# 엑셀 파일 읽기
|
|
|
|
| 24 |
|
| 25 |
for name in product_names:
|
| 26 |
if pd.notna(name): # NaN 값 체크
|
| 27 |
+
clean_name = clean_text(name) # 특수문자 제거
|
| 28 |
+
words = clean_name.split(" ") # 공백 기준으로 단어 분리
|
| 29 |
keywords.extend(words)
|
| 30 |
|
| 31 |
# 키워드 빈도수 계산
|
|
|
|
| 47 |
|
| 48 |
# 새로운 엑셀 파일 생성 및 이미지 삽입
|
| 49 |
with pd.ExcelWriter(output_path, engine='openpyxl') as writer:
|
| 50 |
+
# 엑셀의 첫 3줄을 비워두기 위해 행 인덱스를 3칸 내림
|
| 51 |
+
result_df.to_excel(writer, index=False, startrow=3)
|
| 52 |
workbook = writer.book
|
| 53 |
worksheet = workbook.active
|
| 54 |
|