Raiff1982

Upload 120 files

ed1b365 verified 1 day ago

6.82 kB

	import gradio as gr
	import torch
	from inference import CodetteModelLoader, CodetteEngine


	ADAPTERS = {
	"Newton": "newton",
	"DaVinci": "davinci",
	"Empathy": "empathy",
	"Philosophy": "philosophy",
	"Quantum": "quantum",
	"RC-XI": "consciousness",
	"Multi-Perspective": "multi_perspective",
	"Systems": "systems_architecture"
	}


	def create_chat_app():

	loader = CodetteModelLoader(
	adapters={
	"newton": "adapters/newton/final",
	"davinci": "adapters/davinci/final",
	"empathy": "adapters/empathy/final",
	"philosophy": "adapters/philosophy/final",
	"quantum": "adapters/quantum/final",
	"consciousness": "adapters/consciousness/final",
	"multi_perspective": "adapters/multi_perspective/final",
	"systems_architecture": "adapters/systems_architecture/final",
	}
	)

	loader.load_adapters()

	registry = {
	name: {
	"generation": {
	"temperature": 0.7,
	"top_p": 0.9,
	"max_tokens": 512
	}
	}
	for name in loader.adapters
	}

	engine = CodetteEngine(loader, registry)

	# -----------------------------------------------------
	# CHAT HANDLER
	# -----------------------------------------------------

	def chat_stream(message, history, adapter, temp, top_p, max_tokens):

	messages = []

	for user, assistant in history:
	messages.append({"role": "user", "content": user})
	messages.append({"role": "assistant", "content": assistant})

	messages.append({"role": "user", "content": message})

	if adapter == "All (synthesized)":

	responses = engine.multi_perspective(
	messages,
	list(loader.adapters.keys())
	)

	reply = responses

	history.append((message, reply))

	yield history

	return

	adapter_key = ADAPTERS[adapter]

	loader.set_active_adapter(adapter_key)

	prompt = loader.format_messages(messages)
	inputs = loader.tokenize(prompt)

	streamer = engine.stream_generate(
	inputs,
	temperature=temp,
	top_p=top_p,
	max_tokens=max_tokens
	)

	response = ""

	for token in streamer:

	response += token

	yield history + [(message, response)]

	history.append((message, response))

	# -----------------------------------------------------
	# COMPARISON HANDLER
	# -----------------------------------------------------

	def compare(prompt, adapters):

	outputs = {}

	messages = [{"role": "user", "content": prompt}]

	for name in adapters:

	adapter_key = ADAPTERS[name]

	result = engine.generate(messages, adapter_key)

	outputs[name] = result

	return outputs

	# -----------------------------------------------------
	# STATUS PANEL
	# -----------------------------------------------------

	def get_status():

	device = loader.model.device

	if torch.cuda.is_available():

	mem = torch.cuda.memory_allocated() / 1024**3
	total = torch.cuda.get_device_properties(0).total_memory / 1024**3

	gpu_info = f"{mem:.2f}GB / {total:.2f}GB"

	else:

	gpu_info = "CPU"

	return {
	"Base Model": loader.base_model_name,
	"Active Adapter": loader.active_adapter,
	"Loaded Adapters": list(loader.adapters.keys()),
	"Device": str(device),
	"GPU Memory": gpu_info,
	}

	# -----------------------------------------------------
	# UI LAYOUT
	# -----------------------------------------------------

	with gr.Blocks(theme=gr.themes.Soft(), title="Codette") as app:

	gr.Markdown("# Codette Multi-Perspective AI")

	with gr.Tabs():

	# -------------------------------------------------
	# CHAT TAB
	# -------------------------------------------------

	with gr.Tab("Chat"):

	chatbot = gr.Chatbot(height=500)

	adapter = gr.Dropdown(
	choices=list(ADAPTERS.keys()) + ["All (synthesized)"],
	value="Multi-Perspective",
	label="Reasoning Perspective"
	)

	with gr.Row():

	temperature = gr.Slider(
	0.0,
	1.5,
	value=0.7,
	label="Temperature"
	)

	top_p = gr.Slider(
	0.0,
	1.0,
	value=0.9,
	label="Top P"
	)

	max_tokens = gr.Slider(
	64,
	2048,
	value=512,
	step=64,
	label="Max Tokens"
	)

	msg = gr.Textbox(
	placeholder="Ask Codette something...",
	lines=2
	)

	msg.submit(
	chat_stream,
	[msg, chatbot, adapter, temperature, top_p, max_tokens],
	chatbot
	)

	# -------------------------------------------------
	# COMPARE TAB
	# -------------------------------------------------

	with gr.Tab("Compare"):

	prompt = gr.Textbox(label="Prompt")

	adapters = gr.CheckboxGroup(
	choices=list(ADAPTERS.keys()),
	label="Adapters to Compare",
	value=["Newton", "DaVinci"]
	)

	output = gr.JSON()

	run = gr.Button("Run Comparison")

	run.click(
	compare,
	[prompt, adapters],
	output
	)

	# -------------------------------------------------
	# STATUS TAB
	# -------------------------------------------------

	with gr.Tab("Status"):

	status_output = gr.JSON()

	refresh = gr.Button("Refresh")

	refresh.click(
	get_status,
	None,
	status_output
	)

	return app