Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -286,10 +286,10 @@ if 'run_analysis' in st.session_state and st.session_state.run_analysis:
|
|
| 286 |
def interpret_topics(api_key, topic_results):
|
| 287 |
client = Anthropic(api_key=api_key)
|
| 288 |
|
| 289 |
-
prompt = f"""
|
| 290 |
-
|
| 291 |
{", ".join([f"토픽 {{info['topic_num']}} (비중: {{info['weight']:.1f}}%)" for info in topic_results])}
|
| 292 |
-
|
| 293 |
각 토픽의 주요 단어:
|
| 294 |
"""
|
| 295 |
for info in topic_results:
|
|
@@ -301,35 +301,35 @@ if 'run_analysis' in st.session_state and st.session_state.run_analysis:
|
|
| 301 |
|
| 302 |
prompt += """
|
| 303 |
위 정보를 바탕으로 다음 형식에 맞춰 답변해주세요:
|
| 304 |
-
|
| 305 |
1. 전체 문서의 주제 요약 (3-4문장):
|
| 306 |
[여기에 전체 문서의 주제를 종합적으로 설명해주세요. 각 토픽의 비중을 고려하여 중요도를 반영해주세요.]
|
| 307 |
-
|
| 308 |
2. 각 토픽 요약:
|
| 309 |
[각 토픽에 대해 다음 형식으로 요약해주세요]
|
| 310 |
토픽[번호] [토픽명] [비중]% (상위단어 10개 : {LDA 상위 단어}, TF-IDF 10개 : {TF-IDF 상위 단어})
|
| 311 |
• 토픽명 설명: [토픽명이 이렇게 지어진 이유를 1-2문장으로 설명해주세요. LDA와 TF-IDF 상위 단어들이 어떻게 이 토픽명과 연관되는지 설명하세요.]
|
| 312 |
• 토픽 설명: [1-2문장으로 토픽의 전반적인 내용을 설명해주세요.]
|
| 313 |
-
|
| 314 |
주의사항:
|
| 315 |
1. 토픽명은 "[구체적인 토픽명]" 형식으로 작성해주세요. 예를 들어, "구성원의 전문성 향상을 위한 학습과 역량 개발 방안" 또는 "조직 성과를 높이기 위해 강조되어야 할 학습/역량", "현재 컬리지 멤버 및 본인의 역할에 대한 고민" 등입니다.
|
| 316 |
2. 토픽명은 단순히 단어를 나열하는 것이 아니라, 토픽의 핵심 주제나 의미를 잘 나타내는 구체적인 문구로 만들어주세요.
|
| 317 |
3. 토픽명 설명에서는 왜 그러한 토픽명이 선택되었는지, LDA와 TF-IDF 상위 단어들과의 연관성을 설명해주세요.
|
| 318 |
-
|
| 319 |
-
위 형식에 맞춰 답변해주세요. 사용자가 쉽게 복사하여 사용할 수 있도록 간결하고 명확하게 작성해주세요.
|
| 320 |
-
|
| 321 |
-
\n\nAssistant: 토픽 모델링 결과를 종합적으로 해석해 드리겠습니다.
|
| 322 |
|
| 323 |
-
|
| 324 |
"""
|
| 325 |
|
| 326 |
try:
|
| 327 |
-
response = client.
|
| 328 |
-
model="claude-
|
| 329 |
-
|
| 330 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
| 331 |
)
|
| 332 |
-
return response.
|
| 333 |
except Exception as e:
|
| 334 |
return f"Claude API 호출 중 오류가 발생했습니다: {str(e)}"
|
| 335 |
|
|
|
|
| 286 |
def interpret_topics(api_key, topic_results):
|
| 287 |
client = Anthropic(api_key=api_key)
|
| 288 |
|
| 289 |
+
prompt = f"""다음은 LDA 토픽 모델링 결과로 나온 각 토픽의 정보입니다. 이를 바탕으로 전체 토픽을 종합적으로 해석해주세요:
|
| 290 |
+
|
| 291 |
{", ".join([f"토픽 {{info['topic_num']}} (비중: {{info['weight']:.1f}}%)" for info in topic_results])}
|
| 292 |
+
|
| 293 |
각 토픽의 주요 단어:
|
| 294 |
"""
|
| 295 |
for info in topic_results:
|
|
|
|
| 301 |
|
| 302 |
prompt += """
|
| 303 |
위 정보를 바탕으로 다음 형식에 맞춰 답변해주세요:
|
| 304 |
+
|
| 305 |
1. 전체 문서의 주제 요약 (3-4문장):
|
| 306 |
[여기에 전체 문서의 주제를 종합적으로 설명해주세요. 각 토픽의 비중을 고려하여 중요도를 반영해주세요.]
|
| 307 |
+
|
| 308 |
2. 각 토픽 요약:
|
| 309 |
[각 토픽에 대해 다음 형식으로 요약해주세요]
|
| 310 |
토픽[번호] [토픽명] [비중]% (상위단어 10개 : {LDA 상위 단어}, TF-IDF 10개 : {TF-IDF 상위 단어})
|
| 311 |
• 토픽명 설명: [토픽명이 이렇게 지어진 이유를 1-2문장으로 설명해주세요. LDA와 TF-IDF 상위 단어들이 어떻게 이 토픽명과 연관되는지 설명하세요.]
|
| 312 |
• 토픽 설명: [1-2문장으로 토픽의 전반적인 내용을 설명해주세요.]
|
| 313 |
+
|
| 314 |
주의사항:
|
| 315 |
1. 토픽명은 "[구체적인 토픽명]" 형식으로 작성해주세요. 예를 들어, "구성원의 전문성 향상을 위한 학습과 역량 개발 방안" 또는 "조직 성과를 높이기 위해 강조되어야 할 학습/역량", "현재 컬리지 멤버 및 본인의 역할에 대한 고민" 등입니다.
|
| 316 |
2. 토픽명은 단순히 단어를 나열하는 것이 아니라, 토픽의 핵심 주제나 의미를 잘 나타내는 구체적인 문구로 만들어주세요.
|
| 317 |
3. 토픽명 설명에서는 왜 그러한 토픽명이 선택되었는지, LDA와 TF-IDF 상위 단어들과의 연관성을 설명해주세요.
|
|
|
|
|
|
|
|
|
|
|
|
|
| 318 |
|
| 319 |
+
위 형식에 맞춰 답변해주세요. 사용자가 쉽게 복사하여 사용할 수 있도록 간결하고 명확하게 작성해주세요.
|
| 320 |
"""
|
| 321 |
|
| 322 |
try:
|
| 323 |
+
response = client.messages.create(
|
| 324 |
+
model="claude-3-sonnet-20240229",
|
| 325 |
+
max_tokens=3000,
|
| 326 |
+
temperature=0,
|
| 327 |
+
system="You are an expert in topic modeling and text analysis. Provide clear and concise interpretations of topic modeling results.",
|
| 328 |
+
messages=[
|
| 329 |
+
{"role": "user", "content": prompt}
|
| 330 |
+
]
|
| 331 |
)
|
| 332 |
+
return response.content[0].text
|
| 333 |
except Exception as e:
|
| 334 |
return f"Claude API 호출 중 오류가 발생했습니다: {str(e)}"
|
| 335 |
|