openskynet / src /agents /pi-extensions /context-pruning.test.ts

Mirror OpenSkyNet workspace snapshot from Git HEAD

fc93158 verified 9 days ago

12.7 kB

	import type { AgentMessage } from "@mariozechner/pi-agent-core";
	import type { ToolResultMessage } from "@mariozechner/pi-ai";
	import type { ExtensionAPI, ExtensionContext } from "@mariozechner/pi-coding-agent";
	import { describe, expect, it } from "vitest";
	import {
	computeEffectiveSettings,
	default as contextPruningExtension,
	DEFAULT_CONTEXT_PRUNING_SETTINGS,
	pruneContextMessages,
	} from "./context-pruning.js";
	import { getContextPruningRuntime, setContextPruningRuntime } from "./context-pruning/runtime.js";

	function isToolResultMessage(msg: AgentMessage): msg is ToolResultMessage {
	return msg.role === "toolResult";
	}

	function toolText(msg: ToolResultMessage): string {
	const first = msg.content.find((b) => b.type === "text");
	if (!first \|\| first.type !== "text") {
	return "";
	}
	return first.text;
	}

	function findToolResult(messages: AgentMessage[], toolCallId: string): ToolResultMessage {
	const msg = messages.find((m): m is ToolResultMessage => {
	return isToolResultMessage(m) && m.toolCallId === toolCallId;
	});
	if (!msg) {
	throw new Error(`missing toolResult: ${toolCallId}`);
	}
	return msg;
	}

	function makeToolResult(params: {
	toolCallId: string;
	toolName: string;
	text: string;
	}): ToolResultMessage {
	return {
	role: "toolResult",
	toolCallId: params.toolCallId,
	toolName: params.toolName,
	content: [{ type: "text", text: params.text }],
	isError: false,
	timestamp: Date.now(),
	};
	}

	function makeImageToolResult(params: {
	toolCallId: string;
	toolName: string;
	text: string;
	}): ToolResultMessage {
	const base = makeToolResult(params);
	return {
	...base,
	content: [{ type: "image", data: "AA==", mimeType: "image/png" }, ...base.content],
	};
	}

	function makeAssistant(text: string): AgentMessage {
	return {
	role: "assistant",
	content: [{ type: "text", text }],
	api: "openai-responses",
	provider: "openai",
	model: "fake",
	usage: {
	input: 1,
	output: 1,
	cacheRead: 0,
	cacheWrite: 0,
	totalTokens: 2,
	cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0, total: 0 },
	},
	stopReason: "stop",
	timestamp: Date.now(),
	};
	}

	function makeUser(text: string): AgentMessage {
	return { role: "user", content: text, timestamp: Date.now() };
	}

	type ContextPruningSettings = NonNullable<ReturnType<typeof computeEffectiveSettings>>;
	type PruneArgs = Parameters<typeof pruneContextMessages>[0];
	type PruneOverrides = Omit<PruneArgs, "messages" \| "settings" \| "ctx">;

	const CONTEXT_WINDOW_1000 = {
	model: { contextWindow: 1000 },
	} as unknown as ExtensionContext;

	function makeAggressiveSettings(
	overrides: Partial<ContextPruningSettings> = {},
	): ContextPruningSettings {
	return {
	...DEFAULT_CONTEXT_PRUNING_SETTINGS,
	keepLastAssistants: 0,
	softTrimRatio: 0,
	hardClearRatio: 0,
	minPrunableToolChars: 0,
	hardClear: { enabled: true, placeholder: "[cleared]" },
	softTrim: { maxChars: 10, headChars: 3, tailChars: 3 },
	...overrides,
	};
	}

	function pruneWithAggressiveDefaults(
	messages: AgentMessage[],
	settingsOverrides: Partial<ContextPruningSettings> = {},
	extra: PruneOverrides = {},
	): AgentMessage[] {
	return pruneContextMessages({
	messages,
	settings: makeAggressiveSettings(settingsOverrides),
	ctx: CONTEXT_WINDOW_1000,
	...extra,
	});
	}

	function makeLargeExecToolResult(toolCallId: string, textChar: string): AgentMessage {
	return makeToolResult({
	toolCallId,
	toolName: "exec",
	text: textChar.repeat(20_000),
	});
	}

	function makeSimpleToolPruningMessages(includeTrailingAssistant = false): AgentMessage[] {
	return [
	makeUser("u1"),
	makeAssistant("a1"),
	makeLargeExecToolResult("t1", "x"),
	...(includeTrailingAssistant ? [makeAssistant("a2")] : []),
	];
	}

	type ContextHandler = (
	event: { messages: AgentMessage[] },
	ctx: ExtensionContext,
	) => { messages: AgentMessage[] } \| undefined;

	function createContextHandler(): ContextHandler {
	let handler: ContextHandler \| undefined;
	const api = {
	on: (name: string, fn: unknown) => {
	if (name === "context") {
	handler = fn as ContextHandler;
	}
	},
	appendEntry: (_type: string, _data?: unknown) => {},
	} as unknown as ExtensionAPI;

	contextPruningExtension(api);
	if (!handler) {
	throw new Error("missing context handler");
	}
	return handler;
	}

	function runContextHandler(
	handler: ContextHandler,
	messages: AgentMessage[],
	sessionManager: unknown,
	) {
	return handler({ messages }, {
	model: undefined,
	sessionManager,
	} as unknown as ExtensionContext);
	}

	describe("context-pruning", () => {
	it("mode off disables pruning", () => {
	expect(computeEffectiveSettings({ mode: "off" })).toBeNull();
	expect(computeEffectiveSettings({})).toBeNull();
	});

	it("does not touch tool results after the last N assistants", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	makeAssistant("a1"),
	makeToolResult({
	toolCallId: "t1",
	toolName: "exec",
	text: "x".repeat(20_000),
	}),
	makeUser("u2"),
	makeAssistant("a2"),
	makeToolResult({
	toolCallId: "t2",
	toolName: "exec",
	text: "y".repeat(20_000),
	}),
	makeUser("u3"),
	makeAssistant("a3"),
	makeToolResult({
	toolCallId: "t3",
	toolName: "exec",
	text: "z".repeat(20_000),
	}),
	makeUser("u4"),
	makeAssistant("a4"),
	makeToolResult({
	toolCallId: "t4",
	toolName: "exec",
	text: "w".repeat(20_000),
	}),
	];

	const next = pruneWithAggressiveDefaults(messages, { keepLastAssistants: 3 });

	expect(toolText(findToolResult(next, "t2"))).toContain("y".repeat(20_000));
	expect(toolText(findToolResult(next, "t3"))).toContain("z".repeat(20_000));
	expect(toolText(findToolResult(next, "t4"))).toContain("w".repeat(20_000));
	expect(toolText(findToolResult(next, "t1"))).toBe("[cleared]");
	});

	it("never prunes tool results before the first user message", () => {
	const messages: AgentMessage[] = [
	makeAssistant("bootstrap tool calls"),
	makeToolResult({
	toolCallId: "t0",
	toolName: "read",
	text: "x".repeat(20_000),
	}),
	makeAssistant("greeting"),
	makeUser("u1"),
	makeToolResult({
	toolCallId: "t1",
	toolName: "exec",
	text: "y".repeat(20_000),
	}),
	];

	const next = pruneWithAggressiveDefaults(
	messages,
	{},
	{
	isToolPrunable: () => true,
	contextWindowTokensOverride: 1000,
	},
	);

	expect(toolText(findToolResult(next, "t0"))).toBe("x".repeat(20_000));
	expect(toolText(findToolResult(next, "t1"))).toBe("[cleared]");
	});

	it("hard-clear removes eligible tool results before cutoff", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	makeAssistant("a1"),
	makeLargeExecToolResult("t1", "x"),
	makeLargeExecToolResult("t2", "y"),
	makeUser("u2"),
	makeAssistant("a2"),
	makeLargeExecToolResult("t3", "z"),
	];

	const next = pruneWithAggressiveDefaults(messages, {
	keepLastAssistants: 1,
	softTrimRatio: 10.0,
	softTrim: DEFAULT_CONTEXT_PRUNING_SETTINGS.softTrim,
	});

	expect(toolText(findToolResult(next, "t1"))).toBe("[cleared]");
	expect(toolText(findToolResult(next, "t2"))).toBe("[cleared]");
	// Tool results after the last assistant are protected.
	expect(toolText(findToolResult(next, "t3"))).toContain("z".repeat(20_000));
	});

	it("uses contextWindow override when ctx.model is missing", () => {
	const messages = makeSimpleToolPruningMessages(true);

	const next = pruneContextMessages({
	messages,
	settings: makeAggressiveSettings(),
	ctx: { model: undefined } as unknown as ExtensionContext,
	contextWindowTokensOverride: 1000,
	});

	expect(toolText(findToolResult(next, "t1"))).toBe("[cleared]");
	});

	it("reads per-session settings from registry", async () => {
	const sessionManager = {};

	setContextPruningRuntime(sessionManager, {
	settings: makeAggressiveSettings(),
	contextWindowTokens: 1000,
	isToolPrunable: () => true,
	lastCacheTouchAt: Date.now() - DEFAULT_CONTEXT_PRUNING_SETTINGS.ttlMs - 1000,
	});

	const messages = makeSimpleToolPruningMessages(true);

	const handler = createContextHandler();
	const result = runContextHandler(handler, messages, sessionManager);

	if (!result) {
	throw new Error("expected handler to return messages");
	}
	expect(toolText(findToolResult(result.messages, "t1"))).toBe("[cleared]");
	});

	it("cache-ttl prunes once and resets the ttl window", () => {
	const sessionManager = {};
	const lastTouch = Date.now() - DEFAULT_CONTEXT_PRUNING_SETTINGS.ttlMs - 1000;

	setContextPruningRuntime(sessionManager, {
	settings: makeAggressiveSettings(),
	contextWindowTokens: 1000,
	isToolPrunable: () => true,
	lastCacheTouchAt: lastTouch,
	});

	const messages = makeSimpleToolPruningMessages();

	const handler = createContextHandler();
	const first = runContextHandler(handler, messages, sessionManager);
	if (!first) {
	throw new Error("expected first prune");
	}
	expect(toolText(findToolResult(first.messages, "t1"))).toBe("[cleared]");

	const runtime = getContextPruningRuntime(sessionManager);
	if (!runtime?.lastCacheTouchAt) {
	throw new Error("expected lastCacheTouchAt");
	}
	expect(runtime.lastCacheTouchAt).toBeGreaterThan(lastTouch);

	const second = runContextHandler(handler, messages, sessionManager);
	expect(second).toBeUndefined();
	});

	it("respects tools allow/deny (deny wins; wildcards supported)", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	makeToolResult({
	toolCallId: "t1",
	toolName: "Exec",
	text: "x".repeat(20_000),
	}),
	makeToolResult({
	toolCallId: "t2",
	toolName: "Browser",
	text: "y".repeat(20_000),
	}),
	];

	const next = pruneWithAggressiveDefaults(messages, {
	tools: { allow: ["ex*"], deny: ["exec"] },
	});

	// Deny wins => exec is not pruned, even though allow matches.
	expect(toolText(findToolResult(next, "t1"))).toContain("x".repeat(20_000));
	// allow is non-empty and browser is not allowed => never pruned.
	expect(toolText(findToolResult(next, "t2"))).toContain("y".repeat(20_000));
	});

	it("replaces image blocks in tool results during soft trim", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	makeImageToolResult({
	toolCallId: "t1",
	toolName: "exec",
	text: "visible tool text",
	}),
	];

	const next = pruneWithAggressiveDefaults(messages, {
	hardClearRatio: 10.0,
	hardClear: { enabled: false, placeholder: "[cleared]" },
	softTrim: { maxChars: 200, headChars: 100, tailChars: 100 },
	});

	const tool = findToolResult(next, "t1");
	expect(tool.content.some((b) => b.type === "image")).toBe(false);
	expect(toolText(tool)).toContain("[image removed during context pruning]");
	expect(toolText(tool)).toContain("visible tool text");
	});

	it("soft-trims across block boundaries", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	{
	role: "toolResult",
	toolCallId: "t1",
	toolName: "exec",
	content: [
	{ type: "text", text: "AAAAA" },
	{ type: "text", text: "BBBBB" },
	],
	isError: false,
	timestamp: Date.now(),
	} as ToolResultMessage,
	];

	const next = pruneWithAggressiveDefaults(messages, {
	hardClearRatio: 10.0,
	softTrim: { maxChars: 5, headChars: 7, tailChars: 3 },
	});

	const text = toolText(findToolResult(next, "t1"));
	expect(text).toContain("AAAAA\nB");
	expect(text).toContain("BBB");
	expect(text).toContain("[Tool result trimmed:");
	});

	it("soft-trims oversized tool results and preserves head/tail with a note", () => {
	const messages: AgentMessage[] = [
	makeUser("u1"),
	makeToolResult({
	toolCallId: "t1",
	toolName: "exec",
	text: "abcdefghij".repeat(1000),
	}),
	];

	const next = pruneWithAggressiveDefaults(messages, {
	hardClearRatio: 10.0,
	softTrim: { maxChars: 10, headChars: 6, tailChars: 6 },
	});

	const tool = findToolResult(next, "t1");
	const text = toolText(tool);
	expect(text).toContain("abcdef");
	expect(text).toContain("efghij");
	expect(text).toContain("[Tool result trimmed:");
	});
	});