JSX_TTS / torch /include /ATen /cuda /CUDAGraphsUtils.cuh

Upload 5875 files

9dd3461 almost 3 years ago

2.02 kB

	#pragma once

	#include <ATen/cuda/CUDAGeneratorImpl.h>
	#include <ATen/cuda/CUDAEvent.h>
	#include <ATen/cuda/detail/UnpackRaw.cuh>
	#include <ATen/cuda/detail/CUDAHooks.h>
	#include <ATen/detail/CUDAHooksInterface.h>
	#include <c10/core/StreamGuard.h>
	#include <c10/cuda/CUDAGraphsC10Utils.h>
	#include <c10/cuda/CUDAGuard.h>

	// c10/cuda/CUDAGraphsC10Utils.h has utils used by both c10 and aten.
	// This file adds utils used by aten only.

	namespace at {
	namespace cuda {

	using CaptureId_t = c10::cuda::CaptureId_t;
	using CaptureStatus = c10::cuda::CaptureStatus;

	// Use this version where you don't want to create a CUDA context if none exists.
	inline CaptureStatus currentStreamCaptureStatus() {
	#if defined(CUDA_VERSION) && CUDA_VERSION >= 11000
	// don't create a context if we don't have to
	if (at::cuda::detail::hasPrimaryContext(c10::cuda::current_device())) {
	return c10::cuda::currentStreamCaptureStatusMayInitCtx();
	} else {
	return CaptureStatus::None;
	}
	#else
	return CaptureStatus::None;
	#endif
	}

	inline void assertNotCapturing(std::string attempt) {
	auto status = currentStreamCaptureStatus();
	TORCH_CHECK(status == CaptureStatus::None,
	attempt,
	" during CUDA graph capture. If you need this call to be captured, "
	"please file an issue. "
	"Current cudaStreamCaptureStatus: ",
	status);
	}

	inline void errorIfCapturingCudnnBenchmark(std::string version_specific) {
	auto status = currentStreamCaptureStatus();
	TORCH_CHECK(status == CaptureStatus::None,
	"Current cudaStreamCaptureStatus: ",
	status,
	"\nCapturing ",
	version_specific,
	"is prohibited. Possible causes of this error:\n"
	"1. No warmup iterations occurred before capture.\n"
	"2. The convolutions you're trying to capture use dynamic shapes, "
	"in which case capturing them is generally prohibited.");
	}

	} // namespace cuda
	} // namespace at