cranky-coder08
/

Phi2-Fine-Tuning

Model card Files Files and versions

Metrics Training metrics Community

Phi2-Fine-Tuning / phivenv /Lib /site-packages /torch /include /ATen /native /cuda /ScaledGroupMM.h

cranky-coder08's picture

Add files using upload-large-folder tool

c1af2fa verified 3 months ago

history blame contribute delete

429 Bytes

	#pragma once
	#include <ATen/core/TensorBase.h>
	#include <optional>

	namespace at::cuda::detail {
	TORCH_API void f8f8bf16_grouped_mm(
	at::Tensor mat_a, // FP8
	at::Tensor mat_b, // FP8
	at::Tensor scale_a, // FP32
	at::Tensor scale_b, // FP32
	std::optional<at::Tensor> offs,
	std::optional<at::Tensor> bias, // BF16
	bool use_fast_accum,
	at::Tensor& out);
	} // namespace at::cuda::detail