Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -295,57 +295,58 @@ if 'run_analysis' in st.session_state and st.session_state.run_analysis:
|
|
| 295 |
])
|
| 296 |
st.table(topic_summary_df)
|
| 297 |
|
| 298 |
-
def interpret_topics(api_key, topic_results):
|
| 299 |
-
|
| 300 |
-
|
| 301 |
-
|
| 302 |
-
|
| 303 |
-
|
| 304 |
-
|
| 305 |
-
|
| 306 |
-
|
| 307 |
-
|
| 308 |
-
|
| 309 |
-
|
| 310 |
-
|
| 311 |
-
|
| 312 |
-
|
| 313 |
-
|
| 314 |
-
|
| 315 |
-
|
| 316 |
-
|
| 317 |
-
|
| 318 |
-
|
| 319 |
-
|
| 320 |
-
|
| 321 |
-
|
| 322 |
-
|
| 323 |
-
|
| 324 |
-
|
| 325 |
-
|
| 326 |
-
|
| 327 |
-
|
| 328 |
-
|
| 329 |
-
|
| 330 |
-
|
| 331 |
-
|
| 332 |
-
|
| 333 |
-
|
| 334 |
-
|
| 335 |
-
|
| 336 |
-
|
| 337 |
-
|
| 338 |
-
|
| 339 |
-
|
| 340 |
-
|
| 341 |
-
|
| 342 |
-
|
| 343 |
-
|
| 344 |
-
|
| 345 |
-
|
| 346 |
-
|
| 347 |
-
|
| 348 |
-
|
|
|
|
| 349 |
# Claude API를 사용한 토픽 해석 부분
|
| 350 |
if api_key:
|
| 351 |
st.header("토픽 종합 해석")
|
|
|
|
| 295 |
])
|
| 296 |
st.table(topic_summary_df)
|
| 297 |
|
| 298 |
+
def interpret_topics(api_key, topic_results):
|
| 299 |
+
client = Anthropic(api_key=api_key)
|
| 300 |
+
|
| 301 |
+
prompt = f"""다음은 LDA 토픽 모델링 결과로 나온 각 토픽의 정보입니다. 이를 바탕으로 전체 토픽을 종합적으로 해석해주세요:
|
| 302 |
+
|
| 303 |
+
{", ".join([f"토픽 {{info['topic_num']}} (비중: {{info['weight']:.1f}}%)" for info in topic_results])}
|
| 304 |
+
|
| 305 |
+
각 토픽의 주요 단어:
|
| 306 |
+
"""
|
| 307 |
+
for info in topic_results:
|
| 308 |
+
prompt += f"""
|
| 309 |
+
토픽 {info['topic_num']} (비중: {info['weight']:.1f}%):
|
| 310 |
+
LDA 상위 단어: {', '.join(info['lda_words'][:10])}
|
| 311 |
+
TF-IDF 상위 단어: {', '.join(info['tfidf_words'][:10])}
|
| 312 |
+
"""
|
| 313 |
+
|
| 314 |
+
prompt += """
|
| 315 |
+
위 정보를 바탕으로 다음 형식에 맞춰 답변해주세요:
|
| 316 |
+
|
| 317 |
+
1. 전체 문서의 주제 요약 (3-4문장):
|
| 318 |
+
[여기에 전체 문서의 주제를 종합적으로 설명해주세요. 각 토픽의 비중을 고려하여 중요도를 반영해주세요.]
|
| 319 |
+
|
| 320 |
+
2. 각 토픽 요약:
|
| 321 |
+
[각 토픽에 대해 다음 형식으로 요약해주세요]
|
| 322 |
+
토픽[번호] "[토픽명]" [비중]%
|
| 323 |
+
• LDA 상위 단어 10개: [LDA 상위 단어 10개를 쉼표로 구분하여 나열]
|
| 324 |
+
• TF-IDF 상위 단어 10개: [TF-IDF 상위 단어 10개를 쉼표로 구분하여 나열]
|
| 325 |
+
• 토픽명 설명: [토픽명이 이렇게 지어진 이유를 1-2문장으로 설명해주세요. LDA와 TF-IDF 상위 단어들이 어떻게 이 토픽명과 연관되는지 설명하세요.]
|
| 326 |
+
• 토픽 설명: [2-3문장으로 토픽의 전반적인 내용을 설명해주세요.]
|
| 327 |
+
|
| 328 |
+
주의사항:
|
| 329 |
+
1. 토픽명은 "[구체적인 토픽명]" 형식으로 작성해주세요. 반드시 8어절 이상으로 구체적이고 설명적으로 작성해야 합니다.
|
| 330 |
+
예시: "구성원의 전문성 향상을 위한 체계적인 학습과 역량 개발 방안 모색", "조직의 장기적 성과 향상을 위한 핵심 학습 역량 강화 전략",
|
| 331 |
+
"현재 컬리지 멤버들의 역할 고민과 향후 발전 방향에 대한 논의" 등
|
| 332 |
+
2. 토픽명은 단순히 단어를 나열하는 것이 아니라, 토픽의 핵심 주제나 의미를 잘 나타내는 구체적이고 설명적인 문구로 만들어주세요.
|
| 333 |
+
3. 토픽명 설명에서는 왜 그러한 토픽명이 선택되었는지, LDA와 TF-IDF 상위 단어들과의 연관성을 구체적으로 설명해주세요.
|
| 334 |
+
4. 각 토픽의 LDA 상위 단어와 TF-IDF 상위 단어 10개를 반드시 포함해주세요.
|
| 335 |
+
|
| 336 |
+
위 형식에 맞춰 답변해주세요. 사용자가 쉽게 복사하여 사용할 수 있도록 간결하고 명확하게 작성해주세요.
|
| 337 |
+
"""
|
| 338 |
+
|
| 339 |
+
try:
|
| 340 |
+
response = client.completions.create(
|
| 341 |
+
model="claude-3-sonnet-20240229",
|
| 342 |
+
max_tokens_to_sample=4000,
|
| 343 |
+
temperature=0,
|
| 344 |
+
prompt=f"Human: You are an expert in topic modeling and text analysis. Provide clear, concise, and detailed interpretations of topic modeling results.\n\n{prompt}\n\nAssistant:"
|
| 345 |
+
)
|
| 346 |
+
return response.completion
|
| 347 |
+
except Exception as e:
|
| 348 |
+
return f"Claude API 호출 중 오류가 발생했습니다: {str(e)}"
|
| 349 |
+
|
| 350 |
# Claude API를 사용한 토픽 해석 부분
|
| 351 |
if api_key:
|
| 352 |
st.header("토픽 종합 해석")
|