Spaces:

fantos
/

sum-csv

Paused

App Files Files Community

fantos commited on Apr 26, 2025

Commit

fbaf608

verified ·

1 Parent(s): 691a559

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -11

app.py CHANGED Viewed

@@ -2,6 +2,15 @@ import gradio as gr
 import pandas as pd
 import os
 import tempfile
 def merge_csv_files(files):
     """
@@ -23,20 +32,38 @@ def merge_csv_files(files):
         # 모든 파일을 DataFrame 리스트로 읽기
         dataframes = []
         for file in files:
-            df = pd.read_csv(file.name)
             dataframes.append(df)
         # 모든 DataFrame 병합
-        merged_df = pd.concat(dataframes, ignore_index=True)
-        # 임시 파일에 저장
-        with tempfile.NamedTemporaryFile(delete=False, suffix='.csv') as tmp:
-            output_path = tmp.name
-        # 병합된 데이터 저장
-        merged_df.write_csv(output_path, index=False)
-        return output_path, f"{len(files)}개 파일이 성공적으로 병합되었습니다."
     except Exception as e:
         return None, f"오류 발생: {str(e)}"

 import pandas as pd
 import os
 import tempfile
+import chardet
+def detect_encoding(file_path):
+    """
+    파일의 인코딩을 감지하는 함수
+    """
+    with open(file_path, 'rb') as f:
+        result = chardet.detect(f.read())
+    return result['encoding']
 def merge_csv_files(files):
     """
         # 모든 파일을 DataFrame 리스트로 읽기
         dataframes = []
         for file in files:
+            # 파일의 인코딩 감지
+            encoding = detect_encoding(file.name)
+            try:
+                df = pd.read_csv(file.name, encoding=encoding)
+            except UnicodeDecodeError:
+                # 감지된 인코딩이 실패하면 다른 인코딩 시도
+                encodings_to_try = ['cp949', 'euc-kr', 'latin1', 'ISO-8859-1']
+                for enc in encodings_to_try:
+                    try:
+                        df = pd.read_csv(file.name, encoding=enc)
+                        break
+                    except UnicodeDecodeError:
+                        continue
+                else:
+                    return None, f"파일 '{os.path.basename(file.name)}'의 인코딩을 결정할 수 없습니다."
             dataframes.append(df)
         # 모든 DataFrame 병합
+        if dataframes:
+            merged_df = pd.concat(dataframes, ignore_index=True)
+            # 임시 파일에 저장
+            with tempfile.NamedTemporaryFile(delete=False, suffix='.csv') as tmp:
+                output_path = tmp.name
+            # 병합된 데이터 저장
+            merged_df.to_csv(output_path, index=False, encoding='utf-8')
+            return output_path, f"{len(files)}개 파일이 성공적으로 병합되었습니다."
+        else:
+            return None, "병합할 데이터가 없습니다."
     except Exception as e:
         return None, f"오류 발생: {str(e)}"