Spaces:

simonguest
/

echobot

Running on Zero

App Files Files Community

echobot / app.py

simonguest

Deploy

afee189 about 1 month ago

raw

history blame contribute delete

8.05 kB

	import math
	import time
	import torch
	import gradio as gr
	import spaces
	import pandas as pd

	from datasets import DATASETS
	from model import load_fresh_model, train_model, infer, TOKENIZER
	from logo_b64 import LOGO_B64

	# ---------------------------------------------------------------------------
	# Per-session state factory
	# ---------------------------------------------------------------------------

	def make_state():
	"""Called by gr.State for each new browser session."""
	return {"model": None, "trained_on": None}


	def _detect_device():
	if torch.cuda.is_available():
	return "cuda"
	elif torch.mps.is_available():
	return "mps"
	return "cpu"

	# ---------------------------------------------------------------------------
	# Event handlers
	# ---------------------------------------------------------------------------

	def on_dataset_change(dataset_name):
	pairs = [[inp, out] for inp, out in DATASETS[dataset_name]]
	return pairs


	def _overfitting_warning(loss_records):
	"""Return a warning string if the final loss is extremely low, or None."""
	if not loss_records:
	return None
	final_loss = 10 ** loss_records[-1]["Log Loss"]
	if final_loss < 0.01:
	return (
	"> Possible overfitting: the loss is extremely low, which on a small "
	"dataset usually means the model has memorized the examples rather than "
	"learned the pattern. Try fewer epochs or a lower learning rate."
	)
	return None


	@spaces.GPU(duration=300)
	def on_train(dataset_name, epochs, lr, state):
	"""Generator — yields (progress, state, status, train_btn, reset_btn) after each step."""
	device = _detect_device()
	state["device"] = device

	yield (
	None,
	state,
	"Status: Loading model...",
	gr.update(interactive=False),
	gr.update(interactive=False),
	)

	model = load_fresh_model()
	model.to(device) # type:ignore
	tuples = DATASETS[dataset_name]

	loss_records = []
	for epoch_num, loss in train_model(model, TOKENIZER, tuples, device, epochs=epochs, lr=float(lr)):
	loss_records.append({"Epoch": epoch_num, "Log Loss": math.log10(loss)})
	df = pd.DataFrame(loss_records)
	yield (
	df,
	state,
	f"Status: Training... Epoch {epoch_num}/{epochs} \| Loss: {loss:.4f}",
	gr.update(interactive=False),
	gr.update(interactive=False),
	)

	state["model"] = model.cpu()
	state["trained_on"] = dataset_name

	status = f"Status: Trained on '{dataset_name}'"
	warning = _overfitting_warning(loss_records)
	if warning:
	status += f"\n\n{warning}"

	yield (
	pd.DataFrame(loss_records),
	state,
	status,
	gr.update(interactive=True),
	gr.update(interactive=True),
	)


	def on_reset(state):
	state["model"] = None
	state["trained_on"] = None
	return (
	state,
	"Status: Untrained (echoing)",
	gr.update(interactive=True),
	gr.update(interactive=False),
	None,
	)


	def on_user_message(message, history):
	"""Immediately append the user message and clear the input box."""
	if not message.strip():
	return history, message
	return history + [{"role": "user", "content": message}], ""


	@spaces.GPU
	def on_bot_response(history, num_beams, state):
	"""Run inference and append the assistant reply."""
	if not history or history[-1]["role"] != "user":
	return history
	message = history[-1]["content"]
	if state["model"] is None:
	time.sleep(1)
	response = message
	else:
	device = _detect_device()
	model = state["model"].to(device)
	results = infer(model, TOKENIZER, message, device, num_beams=num_beams)
	model.cpu() # move back to CPU before ZeroGPU releases the allocation
	response = results[0]
	return history + [{"role": "assistant", "content": response}]

	# ---------------------------------------------------------------------------
	# UI
	# ---------------------------------------------------------------------------

	first_dataset = list(DATASETS.keys())[0]

	with gr.Blocks(title="EchoBot", css=".align-bottom { margin-top: auto; margin-bottom: auto }") as demo:
	state = gr.State(make_state)

	gr.HTML(
	'<div style="text-align:center">'
	f'<img src="data:image/png;base64,{LOGO_B64}" style="display:block;margin:0 auto;height:300px">'
	'<p>Select a dataset, train the model, then chat to see how EchoBot responds!</p>'
	'</div>'
	)

	with gr.Row():
	# ---- Column 1: dataset explorer ----
	with gr.Column(scale=1):
	gr.Markdown("## Dataset")
	dataset_dropdown = gr.Dropdown(
	choices=list(DATASETS.keys()),
	value=first_dataset,
	label="Select Dataset",
	)
	dataset_table = gr.Dataframe(
	value=[[inp, out] for inp, out in DATASETS[first_dataset]],
	headers=["Input", "Output"],
	interactive=False,
	label="Input / Output Pairs",
	wrap=True,
	)

	# ---- Column 2: training controls ----
	with gr.Column(scale=1):
	gr.Markdown("## Training")
	status_display = gr.Markdown("Status: Untrained (echoing)")
	epochs_slider = gr.Slider(
	minimum=1, maximum=50, step=1, value=10,
	label="Epochs",
	)
	lr_dropdown = gr.Dropdown(
	choices=[
	("1e-3 — high (aggressive)", "1e-3"),
	("3e-4 — medium (default)", "3e-4"),
	("1e-4 — low (cautious)", "1e-4"),
	("1e-5 — very low (stable)", "1e-5"),
	],
	value="3e-4",
	label="Learning Rate",
	)
	num_beams_slider = gr.Slider(
	minimum=1, maximum=20, step=1, value=10,
	label="Inference Beams",
	)
	train_btn = gr.Button("Train EchoBot", variant="primary")
	loss_plot = gr.LinePlot(
	value=None,
	x="Epoch",
	y="Log Loss",
	label="Training Loss (log scale)",
	min_width=200,
	)
	reset_btn = gr.Button("Reset EchoBot", variant="secondary", interactive=False)

	# ---- Column 3: chat ----
	with gr.Column(scale=1):
	gr.Markdown("## Chat with EchoBot")
	chatbot = gr.Chatbot(type="messages", height=520)
	with gr.Row():
	chat_input = gr.Textbox(
	placeholder="Type a message and press Enter...",
	show_label=False,
	scale=4,
	)
	send_btn = gr.Button("Send", scale=1, elem_classes=["align-bottom"])

	# ---- Event wiring ----
	dataset_dropdown.change(
	fn=on_dataset_change,
	inputs=[dataset_dropdown],
	outputs=[dataset_table],
	)

	train_btn.click(
	fn=on_train,
	inputs=[dataset_dropdown, epochs_slider, lr_dropdown, state],
	outputs=[loss_plot, state, status_display, train_btn, reset_btn],
	)

	reset_btn.click(
	fn=on_reset,
	inputs=[state],
	outputs=[state, status_display, train_btn, reset_btn, loss_plot],
	)

	send_btn.click(
	fn=on_user_message,
	inputs=[chat_input, chatbot],
	outputs=[chatbot, chat_input],
	).then(
	fn=on_bot_response,
	inputs=[chatbot, num_beams_slider, state],
	outputs=[chatbot],
	)

	chat_input.submit(
	fn=on_user_message,
	inputs=[chat_input, chatbot],
	outputs=[chatbot, chat_input],
	).then(
	fn=on_bot_response,
	inputs=[chatbot, num_beams_slider, state],
	outputs=[chatbot],
	)

	demo.queue()
	demo.launch(server_name="0.0.0.0")