Spaces:

data-analysis
/

vt-analytics-system-99

Running

App Files Files Community

vt-analytics-system-99 / app.py

data-analysis

Update app.py

3a0e812 verified 2 months ago

raw

history blame contribute delete

4.83 kB

	import gradio as gr
	import pandas as pd
	import os

	# --- クラウド環境用のシンプルなパス設定 ---
	FILE_PATH = "VTuber_Ultimate_Database.csv"
	OUTPUT_DIR = "output"
	os.makedirs(OUTPUT_DIR, exist_ok=True)

	# データの読み込み
	try:
	df = pd.read_csv(FILE_PATH)
	unique_ids = sorted(df['ハンドル(ID)'].dropna().unique().tolist())
	categories = sorted(df['カテゴリ'].dropna().unique().tolist())
	status_msg = f"正常: {len(df)}件のレコードをデータベースから読み込みました。"
	except Exception as e:
	df = pd.DataFrame()
	unique_ids, categories = [], []
	status_msg = f"エラー: データベースが見つかりません。"

	# --- コアロジック ---
	def filter_and_export(handles, cats, keyword_in, keyword_ex, min_views, min_date, max_results):
	if df.empty:
	return None, None, "エラー: データベースが空、または未接続です。"

	filtered = df.copy()

	if handles:
	filtered = filtered[filtered['ハンドル(ID)'].isin(handles)]
	if cats:
	filtered = filtered[filtered['カテゴリ'].isin(cats)]
	if keyword_in:
	filtered = filtered[filtered['動画タイトル'].str.contains(keyword_in, case=False, na=False)]
	if keyword_ex:
	filtered = filtered[~filtered['動画タイトル'].str.contains(keyword_ex, case=False, na=False)]

	filtered = filtered[filtered['総再生数'] >= min_views]
	if min_date:
	filtered = filtered[filtered['投稿日'] >= min_date]

	filtered = filtered.sort_values('総再生数', ascending=False).head(max_results)

	txt_content = f"【VTuber市場動向解析レポート】\n"
	txt_content += f"出力日時: {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}\n"
	txt_content += f"抽出レコード数: {len(filtered)}件\n"
	txt_content += "=" * 50 + "\n\n"

	for _, row in filtered.iterrows():
	txt_content += f"[{row['ハンドル(ID)']}] {row['動画タイトル']}\n"
	txt_content += f"カテゴリ: {row['カテゴリ']} \| 総再生数: {row['総再生数']:,} \| 高評価数: {row['高評価数']:,}\n"
	txt_content += f"投稿日: {row['投稿日']} \| URL: {row['動画URL']}\n"
	txt_content += "-" * 50 + "\n"

	output_path = os.path.join(OUTPUT_DIR, "Market_Analysis_Report.txt")
	with open(output_path, "w", encoding="utf-8") as f:
	f.write(txt_content)

	return filtered, output_path, f"処理完了: {len(filtered)}件のデータを抽出・出力しました。"

	custom_css = """
	.gradio-container input, .gradio-container textarea, .gradio-container select {
	border: 1px solid #777 !important;
	border-radius: 4px !important;
	}
	"""

	# --- UI構築 ---
	with gr.Blocks(title="VT-Analytics Pro") as app:
	gr.Markdown("## VTuber市場解析システム (VT-Analytics Pro)")
	gr.Markdown("検索条件を指定し、データ抽出およびレポート出力（txt形式）を実行してください。")
	gr.Markdown(f"システムステータス: {status_msg}")

	with gr.Row():
	with gr.Column(scale=1):
	in_handles = gr.Dropdown(choices=unique_ids, multiselect=True, label="対象ID指定 (複数選択可・空欄で全件)")
	in_cats = gr.CheckboxGroup(choices=categories, value=categories, label="コンテンツ種別")
	in_kw_in = gr.Textbox(placeholder="例: 歌ってみた", label="抽出キーワード (含む)")
	in_kw_ex = gr.Textbox(placeholder="例: 初音ミク", label="除外キーワード (含まない)")

	with gr.Row():
	in_min_views = gr.Number(value=100000, label="最低再生数")
	in_min_date = gr.Textbox(value="2024-01-01", label="抽出基準日 (YYYY-MM-DD以降)")

	in_max_res = gr.Slider(minimum=10, maximum=2000, value=1000, step=10, label="最大出力件数制限 (AI解析用)")

	search_btn = gr.Button("データ抽出実行", variant="primary")

	with gr.Column(scale=2):
	out_msg = gr.Textbox(label="実行ログ", interactive=False)
	out_file = gr.File(label="解析レポート (.txt) ダウンロード", interactive=False)
	out_df = gr.Dataframe(label="データプレビュー", interactive=False)

	search_btn.click(
	fn=filter_and_export,
	inputs=[in_handles, in_cats, in_kw_in, in_kw_ex, in_min_views, in_min_date, in_max_res],
	outputs=[out_df, out_file, out_msg]
	)

	if __name__ == "__main__":
	# 🌟 ここがパスワード設定です。Brainの購入者に教えるIDとパスワードになります。
	# 好きな半角英数字に変更してOKです（例では ID: user, パスワード: vtuber2026）
	app.launch(auth=("v", "0409"))