soojeongcrystal commited on
Commit
22d1f37
·
verified ·
1 Parent(s): 56e8124

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +52 -51
app.py CHANGED
@@ -295,57 +295,58 @@ if 'run_analysis' in st.session_state and st.session_state.run_analysis:
295
  ])
296
  st.table(topic_summary_df)
297
 
298
- def interpret_topics(api_key, topic_results):
299
- client = Anthropic(api_key=api_key)
300
-
301
- prompt = f"""다음은 LDA 토픽 모델링 결과로 나온 각 토픽의 정보입니다. 이를 바탕으로 전체 토픽을 종합적으로 해석해주세요:
302
-
303
- {", ".join([f"토픽 {{info['topic_num']}} (비중: {{info['weight']:.1f}}%)" for info in topic_results])}
304
-
305
- 각 토픽의 주요 단어:
306
- """
307
- for info in topic_results:
308
- prompt += f"""
309
- 토픽 {info['topic_num']} (비중: {info['weight']:.1f}%):
310
- LDA 상위 단어: {', '.join(info['lda_words'][:10])}
311
- TF-IDF 상위 단어: {', '.join(info['tfidf_words'][:10])}
312
- """
313
-
314
- prompt += """
315
- 위 정보를 바탕으로 다음 형식에 맞춰 답변해주세요:
316
-
317
- 1. 전체 문서의 주제 요약 (3-4문장):
318
- [여기에 전체 문서의 주제를 종합적으로 설명해주세요. 각 토픽의 비중을 고려하여 중요도를 반영해주세요.]
319
-
320
- 2. 각 토픽 요약:
321
- [각 토픽에 대해 다음 형식으로 요약해주세요]
322
- 토픽[번호] "[토픽명]" [비중]%
323
- • LDA 상위 단어 10개: [LDA 상위 단어 10개를 쉼표로 구분하여 나열]
324
- • TF-IDF 상위 단어 10개: [TF-IDF 상위 단어 10개를 쉼표로 구분하여 나열]
325
- • 토픽명 설명: [토픽명이 이렇게 지어진 이유를 1-2문장으로 설명해주세요. LDA와 TF-IDF 상위 단어들이 어떻게 이 토픽명과 연관되는지 설명하세요.]
326
- • 토픽 설명: [2-3문장으로 토픽의 전반적인 내용을 설명해주세요.]
327
-
328
- 주의사항:
329
- 1. 토픽명은 "[구체적인 토픽명]" 형식으로 작성해주세요. 반드시 8어절 이상으로 구체적이고 설명적으로 작성해야 합니다.
330
- 예시: "구성원의 전문성 향상을 위한 체계적인 학습과 역량 개발 방안 모색", "조직의 장기적 성과 향상을 위한 핵심 학습 역량 강화 전략",
331
- "현재 컬리지 멤버들의 역할 고민과 향후 발전 방향에 대한 논의" 등
332
- 2. 토픽명은 단순히 단어를 나열하는 것이 아니라, 토픽의 핵심 주제나 의미를 잘 나타내는 구체적이고 설명적인 문구로 만들어주세요.
333
- 3. 토픽명 설명에서는 왜 그러한 토픽명이 선택되었는지, LDA와 TF-IDF 상위 단어들과의 연관성을 구체적으로 설명해주세요.
334
- 4. 각 토픽의 LDA 상위 단어와 TF-IDF 상위 단어 10개를 반드시 포함해주세요.
335
-
336
- 위 형식에 맞춰 답변해주세요. 사용자가 쉽게 복사하여 사용할 수 있도록 간결하고 명확하게 작성해주세요.
337
- """
338
-
339
- try:
340
- response = client.completions.create(
341
- model="claude-3-sonnet-20240229",
342
- max_tokens_to_sample=4000,
343
- temperature=0,
344
- prompt=f"Human: You are an expert in topic modeling and text analysis. Provide clear, concise, and detailed interpretations of topic modeling results.\n\n{prompt}\n\nAssistant:"
345
- )
346
- return response.completion
347
- except Exception as e:
348
- return f"Claude API 호출 중 오류가 발생했습니다: {str(e)}"
 
349
  # Claude API를 사용한 토픽 해석 부분
350
  if api_key:
351
  st.header("토픽 종합 해석")
 
295
  ])
296
  st.table(topic_summary_df)
297
 
298
+ def interpret_topics(api_key, topic_results):
299
+ client = Anthropic(api_key=api_key)
300
+
301
+ prompt = f"""다음은 LDA 토픽 모델링 결과로 나온 각 토픽의 정보입니다. 이를 바탕으로 전체 토픽을 종합적으로 해석해주세요:
302
+
303
+ {", ".join([f"토픽 {{info['topic_num']}} (비중: {{info['weight']:.1f}}%)" for info in topic_results])}
304
+
305
+ 각 토픽의 주요 단어:
306
+ """
307
+ for info in topic_results:
308
+ prompt += f"""
309
+ 토픽 {info['topic_num']} (비중: {info['weight']:.1f}%):
310
+ LDA 상위 단어: {', '.join(info['lda_words'][:10])}
311
+ TF-IDF 상위 단어: {', '.join(info['tfidf_words'][:10])}
312
+ """
313
+
314
+ prompt += """
315
+ 위 정보를 바탕으로 다음 형식에 맞춰 답변해주세요:
316
+
317
+ 1. 전체 문서의 주제 요약 (3-4문장):
318
+ [여기에 전체 문서의 주제를 종합적으로 설명해주세요. 각 토픽의 비중을 고려하여 중요도를 반영해주세요.]
319
+
320
+ 2. 각 토픽 요약:
321
+ [각 토픽에 대해 다음 형식으로 요약해주세요]
322
+ 토픽[번호] "[토픽명]" [비중]%
323
+ • LDA 상위 단어 10개: [LDA 상위 단어 10개를 쉼표로 구분하여 나열]
324
+ • TF-IDF 상위 단어 10개: [TF-IDF 상위 단어 10개를 쉼표로 구분하여 나열]
325
+ • 토픽명 설명: [토픽명이 이렇게 지어진 이유를 1-2문장으로 설명해주세요. LDA와 TF-IDF 상위 단어들이 어떻게 이 토픽명과 연관되는지 설명하세요.]
326
+ • 토픽 설명: [2-3문장으로 토픽의 전반적인 내용을 설명해주세요.]
327
+
328
+ 주의사항:
329
+ 1. 토픽명은 "[구체적인 토픽명]" 형식으로 작성해주세요. 반드시 8어절 이상으로 구체적이고 설명적으로 작성해야 합니다.
330
+ 예시: "구성원의 전문성 향상을 위한 체계적인 학습과 역량 개발 방안 모색", "조직의 장기적 성과 향상을 위한 핵심 학습 역량 강화 전략",
331
+ "현재 컬리지 멤버들의 역할 고민과 향후 발전 방향에 대한 논의" 등
332
+ 2. 토픽명은 단순히 단어를 나열하는 것이 아니라, 토픽의 핵심 주제나 의미를 잘 나타내는 구체적이고 설명적인 문구로 만들어주세요.
333
+ 3. 토픽명 설명에서는 왜 그러한 토픽명이 선택되었는지, LDA와 TF-IDF 상위 단어들과의 연관성을 구체적으로 설명해주세요.
334
+ 4. 각 토픽의 LDA 상위 단어와 TF-IDF 상위 단어 10개를 반드시 포함해주세요.
335
+
336
+ 위 형식에 맞춰 답변해주세요. 사용자가 쉽게 복사하여 사용할 수 있도록 간결하고 명확하게 작성해주세요.
337
+ """
338
+
339
+ try:
340
+ response = client.completions.create(
341
+ model="claude-3-sonnet-20240229",
342
+ max_tokens_to_sample=4000,
343
+ temperature=0,
344
+ prompt=f"Human: You are an expert in topic modeling and text analysis. Provide clear, concise, and detailed interpretations of topic modeling results.\n\n{prompt}\n\nAssistant:"
345
+ )
346
+ return response.completion
347
+ except Exception as e:
348
+ return f"Claude API 호출 중 오류가 발생했습니다: {str(e)}"
349
+
350
  # Claude API를 사용한 토픽 해석 부분
351
  if api_key:
352
  st.header("토픽 종합 해석")