soojeongcrystal commited on
Commit
6991d57
·
verified ·
1 Parent(s): a54212a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +40 -11
README.md CHANGED
@@ -1,26 +1,55 @@
1
  # 한국어 토픽 모델링 앱
2
 
3
- 이 Streamlit 앱은 사용자가 CSV 파일을 업로드하고 한국어 텍스트에 대한 토픽 모델링을 수행할 수 있게 해니다. 또한 Claude API를 사용하여 생성된 토픽에 대한 해석을 제공합니다.
4
 
5
- ## 기능
6
 
7
- - CSV 파일 업로드
8
- - 텍스트 컬럼 선택
9
- - 토픽 수 설정
10
  - 한국어 텍스트 전처리 (형태소 분석, 불용어 제거 등)
11
- - 토픽 모델링
12
  - 토픽별 상위 10개 단어와 TF-IDF 값 표시
13
- - 문서 내 토픽 비중 그래프 표시
14
- - Claude API를 용한 토픽 해석
15
 
16
  ## 사용 방법
17
 
18
  1. 사이드바에서 CSV 파일을 업로드합니다.
19
- 2. 텍스트가 포함된 컬럼을 선택합니다.
20
  3. 원하는 토픽 수를 설정합니다.
21
  4. "토픽 모델링 실행" 버튼을 클릭합니다.
22
  5. 결과를 확인합니다.
23
 
24
- ## 참고 사항
25
 
26
- 이 앱을 사용하려면 유효한 Claude API 키가 필요합니다. API 키는 환경 변수로 설정하거나 앱 내에서 직접 입력할 수 있습니다.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  # 한국어 토픽 모델링 앱
2
 
3
+ 이 Streamlit 앱은 사용자가 CSV 파일을 업로드하고 한국어 텍스트에 대한 토픽 모델링을 수행할 수 있게 해주는 도구입니다. 또한 Claude API를 사용하여 생성된 토픽에 대한 해석을 제공합니다.
4
 
5
+ ## 주요 기능
6
 
7
+ - CSV 파일 업로드 및 분석
8
+ - 텍스트 컬럼 선택 기능
9
+ - 사용자 지정 토픽 수 설정
10
  - 한국어 텍스트 전처리 (형태소 분석, 불용어 제거 등)
11
+ - LDA를 이용한 토픽 모델링
12
  - 토픽별 상위 10개 단어와 TF-IDF 값 표시
13
+ - 문서 내 토픽 비중 보여주는 그래프 제공
14
+ - Claude API를 용한 토픽 해석 기능
15
 
16
  ## 사용 방법
17
 
18
  1. 사이드바에서 CSV 파일을 업로드합니다.
19
+ 2. 분석하고자 하는 텍스트가 포함된 컬럼을 선택합니다.
20
  3. 원하는 토픽 수를 설정합니다.
21
  4. "토픽 모델링 실행" 버튼을 클릭합니다.
22
  5. 결과를 확인합니다.
23
 
24
+ ## 주의사항
25
 
26
+ - 이 앱을 사용하려면 유효한 Claude API 키가 필요합니다.
27
+ - API 키는 환경 변수로 설정하거나 앱 내에서 직접 입력할 수 있습니다.
28
+ - 대용량 파일 처리 시 시간이 오래 걸릴 수 있으니 주의해 주세요.
29
+ - API 키와 같은 민감한 정보는 안전하게 관리해 주세요.
30
+
31
+ ## 설치 및 로컬 실행
32
+
33
+ 로컬 환경에서 이 앱을 실행하고 싶다면 다음 단계를 따르세요:
34
+
35
+ 1. 필요한 패키지 설치:
36
+ ```
37
+ pip install -r requirements.txt
38
+ ```
39
+
40
+ 2. 앱 실행:
41
+ ```
42
+ streamlit run app.py
43
+ ```
44
+
45
+ ## 기술 스택
46
+
47
+ - Python
48
+ - Streamlit
49
+ - scikit-learn
50
+ - KoNLPy
51
+ - Anthropic Claude API
52
+
53
+ ## 피드백 및 기여
54
+
55
+ 이 프로젝트에 대한 피드백이나 개선 제안은 언제나 환영합니다. 이슈를 생성하거나 풀 리퀘스트를 보내주세요.