Spaces:

lenzcom
/

Email

Running

App Files Files Community

Email / examples /05_batch /batch.js

lenzcom's picture

Upload folder using huggingface_hub

e706de2 verified about 24 hours ago

history blame contribute delete

1.41 kB

	import {getLlama, LlamaChatSession} from "node-llama-cpp";
	import path from "path";
	import {fileURLToPath} from "url";

	/**
	* Asynchronous execution improves performance in GAIA benchmarks,
	* multi-agent applications, and other high-throughput scenarios.
	*/

	const __dirname = path.dirname(fileURLToPath(import.meta.url));
	const modelPath = path.join(
	__dirname,
	'..',
	'..',
	'models',
	'DeepSeek-R1-0528-Qwen3-8B-Q6_K.gguf'
	)

	const llama = await getLlama({
	logLevel: 'error'
	});
	const model = await llama.loadModel({modelPath});
	const context = await model.createContext({
	sequences: 2,
	batchSize: 1024 // The number of tokens that can be processed at once by the GPU.
	});

	const sequence1 = context.getSequence();
	const sequence2 = context.getSequence();

	const session1 = new LlamaChatSession({
	contextSequence: sequence1
	});
	const session2 = new LlamaChatSession({
	contextSequence: sequence2
	});

	const q1 = "Hi there, how are you?";
	const q2 = "How much is 6+6?";

	console.log('Batching started...')
	const [
	a1,
	a2
	] = await Promise.all([
	session1.prompt(q1),
	session2.prompt(q2)
	]);

	console.log("User: " + q1);
	console.log("AI: " + a1);

	console.log("User: " + q2);
	console.log("AI: " + a2);

	session1.dispose();
	session2.dispose();
	context.dispose();
	model.dispose();
	llama.dispose();