Spaces:

implicit-personalization
/

persona-ui

Running

Jac-Zac

add session-scoped NDIF execution and improve cold-load UX

ae347c6 3 days ago

16.1 kB

	import html
	from dataclasses import dataclass

	import streamlit as st
	from catppuccin import PALETTE
	from persona_data.prompts import format_prompt
	from persona_data.synth_persona import BASELINE_PERSONA_ID, PersonaData, QAPair
	from persona_vectors.artifacts import SUPPORTED_VARIANTS
	from persona_vectors.extraction import (
	MaskStrategy,
	prepare_inputs_for_strategy,
	run_extraction,
	)
	from persona_vectors.preview import TokenSegment, preview_token_segments

	from utils.controls import render_mask_strategy_select
	from utils.datasets import (
	load_dataset,
	load_persona_list_from_dataset,
	warm_qa_in_background,
	)
	from utils.helpers import (
	format_ndif_status,
	persona_label,
	prompt_variant_label,
	session_key,
	widget_key,
	)
	from utils.runtime import cached_model, remote_backend, session_ndif_api_key
	from utils.theme import active_base

	_LAST_VARIANTS_KEY = "extract:last_variants"
	_LAST_BASELINE_KEY = "extract:last_include_baseline"
	_LAST_PERSONA_IDS_KEY = "extract:last_persona_ids"
	_LAST_MAX_QUESTIONS_KEY = "extract:last_max_questions"
	_LAST_MASK_STRATEGY_KEY = "extract:last_mask_strategy"

	_PERSONAS_FILE_KEY = session_key("extract", "personas_file")
	_QA_FILE_KEY = session_key("extract", "qa_file")

	_DEFAULT_MAX_QUESTIONS = 50


	@dataclass(frozen=True)
	class ExtractSettings:
	mask_strategy: MaskStrategy
	max_questions: int


	def _build_run_plan(
	selected_variants: list[str],
	runs: list[tuple[PersonaData, list[QAPair]]],
	) -> list[tuple[PersonaData, list[QAPair], str]]:
	"""Cartesian product of personas x variants."""
	return [(p, qa, v) for v in selected_variants for p, qa in runs]


	def _row_label(persona: PersonaData, variant: str) -> str:
	return f"{persona.name} · {prompt_variant_label(variant)}"


	def _extract_widget_key(
	model_name: str, remote: bool, dataset_source: str, suffix: str
	) -> str:
	return widget_key("extract", str(remote), model_name, dataset_source, suffix)


	def _render_local_dataset_upload(dataset_source: str) -> None:
	if dataset_source != "Local JSONL upload":
	return
	with st.expander("Local dataset upload", expanded=True):
	st.file_uploader(
	"personas.jsonl",
	type=["jsonl"],
	key=_PERSONAS_FILE_KEY,
	help="Expected fields: id, persona, templated_view, biography_view",
	)
	st.file_uploader(
	"qa.jsonl",
	type=["jsonl"],
	key=_QA_FILE_KEY,
	help="Expected fields: id, qid, type, item_type, scope, question, answer",
	)


	def _render_variant_controls(
	*,
	model_name: str,
	remote: bool,
	dataset_source: str,
	) -> tuple[list[str], bool] \| None:
	default_variants = st.session_state.get(
	_LAST_VARIANTS_KEY, list(SUPPORTED_VARIANTS)
	)
	selected_variants = st.multiselect(
	"Persona variants",
	options=SUPPORTED_VARIANTS,
	default=[v for v in default_variants if v in SUPPORTED_VARIANTS]
	or list(SUPPORTED_VARIANTS),
	format_func=prompt_variant_label,
	key=_extract_widget_key(model_name, remote, dataset_source, "persona_variants"),
	help="Extract these variants for each selected persona.",
	)
	include_baseline = st.checkbox(
	"Extract Assistant baseline",
	value=st.session_state.get(_LAST_BASELINE_KEY, False),
	key=_extract_widget_key(model_name, remote, dataset_source, "baseline"),
	help="Also extract the Assistant baseline persona using the first persona's QA set.",
	)
	st.session_state[_LAST_VARIANTS_KEY] = selected_variants
	st.session_state[_LAST_BASELINE_KEY] = include_baseline
	if not selected_variants:
	st.info("Select at least one persona variant.")
	return None
	return selected_variants, include_baseline


	def _load_qa_dataset_personas(
	dataset_source: str,
	) -> tuple[object, list[PersonaData]] \| None:
	try:
	dataset, dataset_status = load_dataset(
	dataset_source,
	personas_file=st.session_state.get(_PERSONAS_FILE_KEY),
	qa_file=st.session_state.get(_QA_FILE_KEY),
	)
	personas = load_persona_list_from_dataset(dataset)
	st.caption(dataset_status)
	except Exception as exc:
	st.error(f"Could not load data: {exc}")
	st.info(
	"Upload both JSONL files or switch to the built-in SynthPersona source."
	)
	return None

	if not getattr(dataset, "supports_qa", True):
	st.info("This dataset is persona-only for now. Use Chat to browse personas.")
	return None

	if not personas:
	st.warning("No personas found in the selected dataset.")
	st.info(
	"Try another dataset source or check that the personas file is not empty."
	)
	return None

	# Extract is the only tab that needs QA; warm it now so the parse overlaps
	# with the user configuring the run instead of blocking the first extract.
	warm_qa_in_background(dataset)
	return dataset, personas


	def _render_persona_select(
	*,
	personas: list[PersonaData],
	model_name: str,
	remote: bool,
	dataset_source: str,
	) -> list[PersonaData] \| None:
	last_persona_ids: set[str] = set(st.session_state.get(_LAST_PERSONA_IDS_KEY, []))
	default_personas = [p for p in personas if p.id in last_persona_ids] or [
	personas[0]
	]
	selected_personas = st.multiselect(
	"Personas",
	options=personas,
	default=default_personas,
	format_func=persona_label,
	key=_extract_widget_key(model_name, remote, dataset_source, "persona_select"),
	)
	st.session_state[_LAST_PERSONA_IDS_KEY] = [p.id for p in selected_personas]

	if not selected_personas:
	st.info("Select at least one persona.")
	return None
	return selected_personas


	_MAX_PREVIEW_SAMPLES = 3


	def _preview_palette():
	flavor = PALETTE.latte if active_base() == "light" else PALETTE.mocha
	return flavor.colors


	def _render_token_legend_html() -> str:
	c = _preview_palette()
	return (
	'<div style="display:flex;gap:12px;flex-wrap:wrap;font-size:0.8em;margin-bottom:8px">'
	f'<span style="background:{c.green.hex};color:{c.base.hex};'
	'padding:1px 6px;border-radius:3px">masked</span>'
	f'<span style="color:{c.yellow.hex};padding:1px 6px">question</span>'
	f'<span style="color:{c.sky.hex};padding:1px 6px">response</span>'
	f'<span style="color:{c.mauve.hex};font-weight:bold;padding:1px 6px">special</span>'
	f'<span style="color:{c.subtext1.hex};padding:1px 6px">template</span>'
	"</div>"
	)


	def _token_style(segment: TokenSegment) -> str:
	c = _preview_palette()
	style = {
	"response": f"color:{c.sky.hex}",
	"question": f"color:{c.yellow.hex}",
	}.get(segment.role, f"color:{c.subtext1.hex}")

	if segment.is_special:
	style = f"color:{c.mauve.hex};font-weight:bold"
	if segment.is_masked:
	style = (
	f"{style};background:{c.green.hex};color:{c.base.hex};"
	"border-radius:2px;padding:0 1px"
	)
	return style


	def _render_sample_tokens_html(p, tokenizer, *, max_tokens: int = 200) -> str:
	spans: list[str] = []
	for segment in preview_token_segments(p, tokenizer, max_tokens=max_tokens):
	spans.append(
	f'<span style="{_token_style(segment)}">{html.escape(segment.text)}</span>'
	)

	return (
	'<pre style="white-space:pre-wrap;font-size:0.82em;line-height:1.5;'
	"background:var(--secondary-background-color,rgba(127,127,127,0.08));"
	"padding:8px 10px;border-radius:6px;"
	'border:1px solid rgba(127,127,127,0.25);margin:0">'
	f"{''.join(spans)}</pre>"
	)


	def _render_mask_strategy_select(
	*,
	model_name: str,
	remote: bool,
	dataset_source: str,
	) -> MaskStrategy:
	return render_mask_strategy_select(
	key=_extract_widget_key(model_name, remote, dataset_source, "mask_strategy"),
	last_key=_LAST_MASK_STRATEGY_KEY,
	help_text="Which tokens contribute to the averaged hidden state.",
	)


	def _collect_runs(
	*,
	dataset,
	selected_personas: list[PersonaData],
	) -> list[tuple[PersonaData, list[QAPair]]] \| None:
	runs, skipped = [], []
	for persona in selected_personas:
	if persona.id == BASELINE_PERSONA_ID:
	qa = list(
	dataset.get_qa(BASELINE_PERSONA_ID, item_type="mcq", scope="shared")
	)
	elif hasattr(dataset, "train_test_split"):
	qa, _ = dataset.train_test_split(persona.id)
	else:
	qa = list(dataset.get_qa(persona.id))
	if qa:
	runs.append((persona, qa))
	else:
	skipped.append(persona)
	if skipped:
	names = ", ".join(p.name for p in skipped)
	st.warning(f"No train QA pairs found for: {names}. They will be skipped.")
	if not runs:
	st.info("No personas have matching QA pairs.")
	return None
	return runs


	def _render_max_questions(
	*,
	model_name: str,
	remote: bool,
	dataset_source: str,
	runs: list[tuple[PersonaData, list[QAPair]]],
	) -> int:
	max_q = min(len(qa_pairs) for _, qa_pairs in runs)
	default = min(_DEFAULT_MAX_QUESTIONS, max_q)
	max_questions = st.slider(
	"Max questions (train split)",
	min_value=1,
	max_value=max_q,
	value=min(
	max(st.session_state.get(_LAST_MAX_QUESTIONS_KEY, default), 1), max_q
	),
	key=_extract_widget_key(model_name, remote, dataset_source, "max_questions"),
	)
	st.session_state[_LAST_MAX_QUESTIONS_KEY] = max_questions
	return max_questions


	def _render_extract_actions() -> tuple[bool, bool]:
	run_col, preview_col, _spacer = st.columns([1, 1, 4], gap="small")
	with run_col:
	run_clicked = st.button(
	"Run extraction",
	type="primary",
	width="stretch",
	)
	with preview_col:
	preview_clicked = st.button("Preview tokens", width="stretch")
	return run_clicked, preview_clicked


	def _render_token_preview(
	*,
	model_name: str,
	run_plan: list[tuple[PersonaData, list[QAPair], str]],
	settings: ExtractSettings,
	) -> None:
	with st.spinner("Loading tokenizer..."):
	model = cached_model(model_name=model_name)
	st.markdown(_render_token_legend_html(), unsafe_allow_html=True)
	for persona, qa_pairs, variant in run_plan:
	system_prompt = format_prompt(persona, variant) # type: ignore[arg-type]
	prepared = prepare_inputs_for_strategy(
	tokenizer=model.tokenizer,
	system_prompt=system_prompt,
	qa_pairs=qa_pairs[: settings.max_questions],
	mask_strategy=settings.mask_strategy,
	)
	st.caption(_row_label(persona, variant))
	for i, p in enumerate(prepared[:_MAX_PREVIEW_SAMPLES]):
	question = p.question if len(p.question) <= 60 else p.question[:57] + "..."
	seq_len = int(p.input_ids.shape[0])
	masked = int(p.token_mask.sum())
	label = f"sample {i} — {question} (len={seq_len}, masked={masked})"
	with st.expander(label):
	st.markdown(
	_render_sample_tokens_html(p, model.tokenizer),
	unsafe_allow_html=True,
	)
	if len(prepared) > _MAX_PREVIEW_SAMPLES:
	remaining = len(prepared) - _MAX_PREVIEW_SAMPLES
	st.caption(f"… and {remaining} more sample(s) not shown.")


	def _run_extraction_plan(
	*,
	remote: bool,
	model_name: str,
	run_plan: list[tuple[PersonaData, list[QAPair], str]],
	settings: ExtractSettings,
	) -> None:
	status_box = st.empty()
	status_box.info("Extraction in progress...")
	progress = st.progress(0, text="Preparing extraction...")
	ndif_status_box = st.empty()

	def _on_ndif_status(job_id: str, status_name: str, description: str) -> None:
	ndif_status_box.caption(format_ndif_status(job_id, status_name, description))

	with st.spinner("Loading model..."):
	model = cached_model(model_name=model_name)

	try:
	total_steps = len(run_plan)
	results = []
	for step, (persona, qa_pairs, variant) in enumerate(run_plan):
	progress.progress(
	step / total_steps if total_steps else 1.0,
	text=f"{_row_label(persona, variant)} ({step + 1}/{total_steps})",
	)
	selected_qa = qa_pairs[: settings.max_questions]
	results.extend(
	run_extraction(
	model=model,
	model_name=model_name,
	qa_pairs=selected_qa,
	variants=(variant,),
	persona=persona,
	mask_strategy=settings.mask_strategy,
	remote=remote,
	on_status=_on_ndif_status if remote else None,
	backend_factory=(
	(
	lambda: remote_backend(
	model,
	session_ndif_api_key(),
	on_status=_on_ndif_status,
	)
	)
	if remote
	else None
	),
	)
	)

	progress.progress(1.0, text="Extraction complete")
	except Exception as exc:
	st.error(f"Extraction failed: {exc}")
	return
	finally:
	progress.empty()
	ndif_status_box.empty()

	status_box.empty()
	st.success(f"Saved {len(results)} artifact set(s)")

	for result in results:
	st.markdown(
	f"- {result.persona_name} · {prompt_variant_label(result.variant)}: "
	f"{result.n_questions} questions"
	)


	def render_extract_tab(remote: bool, model_name: str, dataset_source: str) -> None:
	"""Render the extraction tab."""

	st.title("Extract")
	st.caption("Extract per-persona activation vectors from train QA pairs.")

	_render_local_dataset_upload(dataset_source)
	variant_choice = _render_variant_controls(
	model_name=model_name,
	remote=remote,
	dataset_source=dataset_source,
	)
	if variant_choice is None:
	return
	selected_variants, include_baseline = variant_choice

	loaded = _load_qa_dataset_personas(dataset_source)
	if loaded is None:
	return
	dataset, personas = loaded

	selected_personas = _render_persona_select(
	personas=personas,
	model_name=model_name,
	remote=remote,
	dataset_source=dataset_source,
	)
	if selected_personas is None:
	return

	personas_for_runs = list(selected_personas)
	baseline = getattr(dataset, "baseline", None)
	if include_baseline and baseline is not None:
	personas_for_runs.append(baseline)

	runs = _collect_runs(dataset=dataset, selected_personas=personas_for_runs)
	if runs is None:
	return

	max_questions = _render_max_questions(
	model_name=model_name,
	remote=remote,
	dataset_source=dataset_source,
	runs=runs,
	)
	with st.expander("Advanced", expanded=False):
	mask_strategy = _render_mask_strategy_select(
	model_name=model_name,
	remote=remote,
	dataset_source=dataset_source,
	)
	settings = ExtractSettings(
	mask_strategy=mask_strategy,
	max_questions=max_questions,
	)

	run_clicked, preview_clicked = _render_extract_actions()
	run_plan = _build_run_plan(selected_variants, runs)

	if preview_clicked:
	_render_token_preview(
	model_name=model_name,
	run_plan=run_plan,
	settings=settings,
	)
	return

	if not run_clicked:
	return

	_run_extraction_plan(
	remote=remote,
	model_name=model_name,
	run_plan=run_plan,
	settings=settings,
	)