Spaces:

OpceanAI
/

Yuuki

Running

Yuuki / app.py

Gogs

🔧 Switch to Inference API (no local model loading)

3ce8ecc 3 days ago

14.9 kB

	import gradio as gr
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import torch

	# ============================================================================
	# YUUKI - Mobile-Trained Code Generator
	# ============================================================================

	MODEL_ID = "OpceanAI/Yuuki-best"
	MODEL_LOADED = False
	model = None
	tokenizer = None


	def load_model():
	global model, tokenizer, MODEL_LOADED

	if MODEL_LOADED:
	return True

	try:
	print("Loading Yuuki model...")

	tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
	model = AutoModelForCausalLM.from_pretrained(
	MODEL_ID,
	torch_dtype=torch.float32,
	low_cpu_mem_usage=True,
	trust_remote_code=True
	)

	if tokenizer.pad_token is None:
	tokenizer.pad_token = tokenizer.eos_token

	MODEL_LOADED = True
	print("Model loaded successfully!")
	return True

	except Exception as e:
	print(f"Error loading model: {e}")
	return False


	def generate_code(
	prompt: str,
	max_new_tokens: int = 100,
	temperature: float = 0.7,
	top_p: float = 0.9,
	top_k: int = 50,
	repetition_penalty: float = 1.1
	) -> str:

	if not MODEL_LOADED:
	if not load_model():
	return "Error: Model failed to load. Please try refreshing the page."

	if not prompt or not prompt.strip():
	return "Please enter a code prompt."

	try:
	inputs = tokenizer(
	prompt,
	return_tensors="pt",
	truncation=True,
	max_length=512
	)

	with torch.no_grad():
	outputs = model.generate(
	**inputs,
	max_new_tokens=max_new_tokens,
	temperature=temperature,
	top_p=top_p,
	top_k=top_k,
	repetition_penalty=repetition_penalty,
	do_sample=True,
	pad_token_id=tokenizer.pad_token_id,
	eos_token_id=tokenizer.eos_token_id,
	num_return_sequences=1
	)

	generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
	return generated_text

	except Exception as e:
	return f"Generation error: {str(e)}"


	# ============================================================================
	# CSS
	# ============================================================================

	CUSTOM_CSS = """
	.gradio-container {
	max-width: 100% !important;
	padding: 0 !important;
	margin: 0 !important;
	background: #0a0a0a !important;
	min-height: 100vh;
	}

	.main {
	background: #0a0a0a !important;
	}

	footer {
	display: none !important;
	}

	#header {
	display: flex;
	align-items: center;
	justify-content: space-between;
	padding: 16px 24px;
	border-bottom: 1px solid #1f1f1f;
	background: #0a0a0a;
	}

	#logo {
	font-size: 1.25rem;
	font-weight: 600;
	color: #fafafa;
	}

	#version-tag {
	color: #666;
	font-weight: 400;
	font-size: 0.875rem;
	margin-left: 8px;
	}

	#chat-container {
	max-width: 800px;
	margin: 0 auto;
	padding: 40px 24px;
	}

	#welcome-box {
	text-align: center;
	margin-bottom: 32px;
	}

	#welcome-title {
	font-size: 2rem;
	font-weight: 600;
	color: #fafafa;
	margin-bottom: 8px;
	}

	#welcome-subtitle {
	font-size: 1rem;
	color: #666;
	margin-bottom: 16px;
	}

	#disclaimer {
	background: #18181b;
	border: 1px solid #27272a;
	border-radius: 8px;
	padding: 12px 16px;
	color: #a1a1a1;
	font-size: 0.8rem;
	text-align: left;
	display: inline-block;
	max-width: 600px;
	}

	#output-box textarea {
	background: #141414 !important;
	color: #e5e5e5 !important;
	font-family: monospace !important;
	font-size: 0.875rem !important;
	border: 1px solid #262626 !important;
	border-radius: 12px !important;
	}

	#input-box textarea {
	background: #141414 !important;
	color: #fafafa !important;
	border: 1px solid #262626 !important;
	border-radius: 12px !important;
	}

	#input-box textarea::placeholder {
	color: #525252 !important;
	}

	#generate-btn {
	background: #fafafa !important;
	color: #0a0a0a !important;
	border: none !important;
	border-radius: 8px !important;
	font-weight: 600 !important;
	}

	#generate-btn:hover {
	background: #e5e5e5 !important;
	}

	#examples-label {
	color: #525252;
	font-size: 0.75rem;
	text-transform: uppercase;
	letter-spacing: 0.05em;
	margin-bottom: 12px;
	margin-top: 16px;
	}

	.example-btn {
	background: #141414 !important;
	border: 1px solid #262626 !important;
	color: #a1a1a1 !important;
	font-family: monospace !important;
	border-radius: 8px !important;
	}

	.example-btn:hover {
	background: #1f1f1f !important;
	border-color: #404040 !important;
	color: #fafafa !important;
	}

	.panel-section {
	background: #141414;
	border: 1px solid #262626;
	border-radius: 12px;
	padding: 24px;
	margin-bottom: 16px;
	}

	.panel-title {
	font-size: 0.875rem;
	font-weight: 600;
	color: #fafafa;
	margin-bottom: 16px;
	}

	.info-row {
	display: flex;
	justify-content: space-between;
	padding: 12px 0;
	border-bottom: 1px solid #1f1f1f;
	}

	.info-row:last-child {
	border-bottom: none;
	}

	.info-label {
	color: #666;
	font-size: 0.875rem;
	}

	.info-value {
	color: #fafafa;
	font-size: 0.875rem;
	font-weight: 500;
	}

	.score-grid {
	display: flex;
	gap: 8px;
	flex-wrap: wrap;
	}

	.score-badge {
	padding: 6px 12px;
	border-radius: 6px;
	font-size: 0.75rem;
	font-weight: 600;
	}

	.score-good {
	background: rgba(34, 197, 94, 0.15);
	color: #22c55e;
	border: 1px solid rgba(34, 197, 94, 0.3);
	}

	.score-medium {
	background: rgba(234, 179, 8, 0.15);
	color: #eab308;
	border: 1px solid rgba(234, 179, 8, 0.3);
	}

	.score-weak {
	background: rgba(239, 68, 68, 0.15);
	color: #ef4444;
	border: 1px solid rgba(239, 68, 68, 0.3);
	}

	.comparison-table {
	width: 100%;
	border-collapse: collapse;
	font-size: 0.875rem;
	}

	.comparison-table th,
	.comparison-table td {
	padding: 12px;
	text-align: left;
	border-bottom: 1px solid #1f1f1f;
	}

	.comparison-table th {
	color: #666;
	font-weight: 500;
	font-size: 0.75rem;
	text-transform: uppercase;
	}

	.comparison-table td {
	color: #a1a1a1;
	}

	.comparison-table strong {
	color: #22c55e;
	}

	.links-grid {
	display: flex;
	gap: 16px;
	flex-wrap: wrap;
	}

	.link-item {
	color: #a1a1a1;
	text-decoration: none;
	font-size: 0.875rem;
	}

	.link-item:hover {
	color: #fafafa;
	}

	.gr-tab-nav button {
	background: transparent !important;
	border: none !important;
	color: #666 !important;
	}

	.gr-tab-nav button.selected {
	color: #fafafa !important;
	border-bottom: 2px solid #fafafa !important;
	}

	.gr-prose {
	color: #a1a1a1 !important;
	}

	.gr-prose strong {
	color: #fafafa !important;
	}
	"""


	# ============================================================================
	# Interface
	# ============================================================================

	with gr.Blocks(
	css=CUSTOM_CSS,
	title="Yuuki",
	theme=gr.themes.Base(
	primary_hue="neutral",
	secondary_hue="neutral",
	neutral_hue="neutral",
	).set(
	body_background_fill="#0a0a0a",
	body_background_fill_dark="#0a0a0a",
	block_background_fill="#141414",
	block_background_fill_dark="#141414",
	block_border_color="#262626",
	block_border_color_dark="#262626",
	body_text_color="#a1a1a1",
	body_text_color_dark="#a1a1a1",
	input_background_fill="#141414",
	input_background_fill_dark="#141414",
	)
	) as demo:

	# Header
	gr.HTML('<div id="header"><div id="logo">Yuuki <span id="version-tag">v0.1-preview</span></div></div>')

	# Tabs
	with gr.Tabs():

	# Chat Tab
	with gr.Tab("Chat"):
	gr.HTML('<div id="chat-container">')
	gr.HTML('<div id="welcome-box"><div id="welcome-title">Yuuki</div><div id="welcome-subtitle">Mobile-trained code generation model</div><div id="disclaimer"><strong>Experimental model.</strong> Best at Agda (55/100). Limited C, Assembly. Weak Python. Trained on smartphone CPU.</div></div>')

	output = gr.Textbox(
	label="Output",
	lines=10,
	show_copy_button=True,
	elem_id="output-box",
	placeholder="Generated code will appear here..."
	)

	with gr.Row():
	prompt_input = gr.Textbox(
	label="",
	placeholder="Enter code prompt... (e.g., module Main where)",
	lines=2,
	elem_id="input-box",
	show_label=False,
	scale=4
	)
	generate_btn = gr.Button("Generate", variant="primary", elem_id="generate-btn", scale=1)

	gr.HTML('<div id="examples-label">Try these</div>')
	with gr.Row():
	ex1 = gr.Button("module Main where", elem_classes=["example-btn"], size="sm")
	ex2 = gr.Button("open import Data.Nat", elem_classes=["example-btn"], size="sm")
	ex3 = gr.Button("int main() {", elem_classes=["example-btn"], size="sm")
	ex4 = gr.Button("def hello():", elem_classes=["example-btn"], size="sm")

	gr.HTML('</div>')

	# Settings Tab
	with gr.Tab("Settings"):
	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">Generation Parameters</div>')

	with gr.Row():
	with gr.Column():
	max_new_tokens = gr.Slider(minimum=20, maximum=256, value=100, step=10, label="Max Tokens")
	temperature = gr.Slider(minimum=0.1, maximum=1.5, value=0.7, step=0.1, label="Temperature")
	top_p = gr.Slider(minimum=0.1, maximum=1.0, value=0.9, step=0.05, label="Top P")
	with gr.Column():
	top_k = gr.Slider(minimum=1, maximum=100, value=50, step=5, label="Top K")
	repetition_penalty = gr.Slider(minimum=1.0, maximum=2.0, value=1.1, step=0.05, label="Repetition Penalty")

	# Info Tab
	with gr.Tab("Info"):
	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">Model Information</div>')
	gr.HTML('<div class="info-row"><span class="info-label">Model</span><span class="info-value">Yuuki-best (checkpoint-2000)</span></div>')
	gr.HTML('<div class="info-row"><span class="info-label">Size</span><span class="info-value">988 MB</span></div>')
	gr.HTML('<div class="info-row"><span class="info-label">Training Progress</span><span class="info-value">2,000 / 37,500 steps (5.3%)</span></div>')
	gr.HTML('<div class="info-row"><span class="info-label">Hardware</span><span class="info-value">Snapdragon 685 (CPU only)</span></div>')
	gr.HTML('<div class="info-row"><span class="info-label">Speed</span><span class="info-value">~86 sec/step</span></div>')
	gr.HTML('<div class="info-row"><span class="info-label">Cost</span><span class="info-value">$0.00</span></div>')

	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">Language Performance</div>')
	gr.HTML('<div class="score-grid"><span class="score-badge score-good">Agda: 55/100</span><span class="score-badge score-medium">C: 20/100</span><span class="score-badge score-medium">Assembly: 15/100</span><span class="score-badge score-weak">Python: 8/100</span></div>')
	gr.HTML('<p style="color: #666; font-size: 0.8rem; margin-top: 16px;">Average quality: 24.6/100 (+146% from checkpoint 1400)</p>')

	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">Checkpoint Comparison</div>')
	gr.HTML('<table class="comparison-table"><thead><tr><th>Metric</th><th>CP-1400</th><th>CP-2000</th></tr></thead><tbody><tr><td>Progress</td><td>3.7%</td><td><strong>5.3%</strong></td></tr><tr><td>Agda</td><td>20/100</td><td><strong>55/100</strong></td></tr><tr><td>C</td><td>8/100</td><td><strong>20/100</strong></td></tr><tr><td>Assembly</td><td>2/100</td><td><strong>15/100</strong></td></tr><tr><td>Average</td><td>~10/100</td><td><strong>24.6/100</strong></td></tr></tbody></table>')

	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">About</div>')
	gr.Markdown("This is the best model available at this moment. The full v0.1 release is coming soon. Once published, plans for v0.2 will begin.\n\nYuuki is being trained entirely on a smartphone CPU by a single person. A research paper exploring mobile LLM training will be published soon.\n\nWhy this matters:\n- Students without GPU access can experiment with ML\n- Democratizes ML research globally\n- Explores edge ML training possibilities")

	with gr.Column(elem_classes=["panel-section"]):
	gr.HTML('<div class="panel-title">Links</div>')
	gr.HTML('<div class="links-grid"><a href="https://huggingface.co/OpceanAI/Yuuki-best" target="_blank" class="link-item">Model Card</a><a href="https://huggingface.co/OpceanAI/Yuuki" target="_blank" class="link-item">Original Yuuki</a><a href="https://github.com/YuuKi-OS/yuuki-training" target="_blank" class="link-item">Training Code</a></div>')
	gr.HTML('<p style="color: #525252; font-size: 0.75rem; margin-top: 24px;">Licensed under Apache 2.0</p>')

	# Event handlers
	generate_btn.click(
	fn=generate_code,
	inputs=[prompt_input, max_new_tokens, temperature, top_p, top_k, repetition_penalty],
	outputs=output
	)

	prompt_input.submit(
	fn=generate_code,
	inputs=[prompt_input, max_new_tokens, temperature, top_p, top_k, repetition_penalty],
	outputs=output
	)

	ex1.click(lambda: "module Main where", outputs=prompt_input)
	ex2.click(lambda: "open import Data.Nat", outputs=prompt_input)
	ex3.click(lambda: "int main() {", outputs=prompt_input)
	ex4.click(lambda: "def hello():", outputs=prompt_input)


	# Launch
	if __name__ == "__main__":
	demo.launch(share=False, show_error=True, show_api=False)