Add files using upload-large-folder tool

a402b9b verified about 1 month ago

1.47 kB

	import unittest

	import torch

	from sglang.srt.layers.quantization.fp8_utils import (
	inverse_transform_scale_ue8m0,
	quant_weight_ue8m0,
	transform_scale_ue8m0,
	)
	from sglang.test.ci.ci_register import register_cuda_ci
	from sglang.test.test_utils import CustomTestCase

	register_cuda_ci(est_time=9, suite="stage-b-test-large-1-gpu")


	class TestInverseTransformScaleUe8m0(CustomTestCase):
	def test_round_trip(self):
	for _ in range(100):
	weight_bf16 = torch.randn(
	# DeepSeek V3 kv_b_proj
	(32768, 512),
	dtype=torch.bfloat16,
	device="cuda",
	)

	weight_block_size = [128, 128]

	qweight, sf_fp32_original = quant_weight_ue8m0(
	weight_bf16, weight_block_size=weight_block_size
	)
	mn = qweight.shape[-2]

	sf_packed_original = transform_scale_ue8m0(sf_fp32_original, mn=mn)
	sf_fp32_recreated = inverse_transform_scale_ue8m0(sf_packed_original, mn=mn)

	sf_packed_recreated = transform_scale_ue8m0(sf_fp32_recreated, mn=mn)

	assert torch.all(
	sf_packed_original == sf_packed_recreated
	), f"{sf_packed_original=} {sf_packed_recreated}"
	assert torch.all(
	sf_fp32_original == sf_fp32_recreated
	), f"{sf_fp32_original=} {sf_fp32_recreated}"


	if __name__ == "__main__":
	unittest.main()