Spaces:

dltmdgus
/

topic_modeling

Sleeping

topic_modeling / app.py

Update app.py

5488719 verified over 1 year ago

1.69 kB

	import streamlit as st
	import pandas as pd


	# 파일 경로 설정
	FILE_PATH = "book_topics_output_modified.xlsx"

	# 엑셀 파일을 읽어오는 함수
	def load_data(file_path):
	return pd.read_excel(file_path)

	# Streamlit 애플리케이션
	def main():
	st.title("키워드 기반 도서 추천")

	# 데이터 로드
	data = load_data(FILE_PATH)

	# 최종토픽 열이 있는지 확인
	if '최종토픽' not in data.columns:
	st.error("최종토픽 열이 데이터에 없습니다.")
	return

	# 최종토픽 카테고리 선택
	topic_category = st.selectbox(
	"최종토픽을 선택하세요:",
	sorted(data['최종토픽'].unique())
	)

	# 선택된 토픽에 해당하는 도서 목록 필터링
	filtered_data = data[data['최종토픽'] == topic_category]


	# 도서명 열이 있는지 확인
	if '도서명' not in data.columns:
	st.error("도서명 열이 데이터에 없습니다.")
	return

	# 숫자 열이 있는지 확인
	numeric_cols = [col for col in filtered_data.columns if pd.api.types.is_numeric_dtype(filtered_data[col])]
	if not numeric_cols:
	st.error("숫자 열이 없습니다.")
	return

	# 가장 높은 값을 가진 숫자 열 선택
	number_col = numeric_cols[0] # 첫 번째 숫자 열 사용

	# 상위 10개 도서명 추출
	top_books = filtered_data.nlargest(20, number_col)[['도서명', number_col]]



	# 도서명만 출력
	st.write(f"최종토픽 '{topic_category}'에 해당하는 상위 20개 도서명:")
	st.dataframe(top_books[['도서명']]) # 도서명만 표시


	if __name__ == "__main__":
	main()