lrh12580

first commit

5cb6c4b about 2 years ago

1.63 kB

	#include "cuda_runtime.h"
	#include "curand.h"
	#include "cublas_v2.h"

	extern "C" {
	#include "avgpool_layer.h"
	#include "cuda_dark.h"
	}

	__global__ void forward_avgpool_layer_kernel(int n, int w, int h, int c, float input, float output)
	{
	int id = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;
	if(id >= n) return;

	int k = id % c;
	id /= c;
	int b = id;

	int i;
	int out_index = (k + c*b);
	output[out_index] = 0;
	for(i = 0; i < w*h; ++i){
	int in_index = i + hw(k + b*c);
	output[out_index] += input[in_index];
	}
	output[out_index] /= w*h;
	}

	__global__ void backward_avgpool_layer_kernel(int n, int w, int h, int c, float in_delta, float out_delta)
	{
	int id = (blockIdx.x + blockIdx.ygridDim.x) blockDim.x + threadIdx.x;
	if(id >= n) return;

	int k = id % c;
	id /= c;
	int b = id;

	int i;
	int out_index = (k + c*b);
	for(i = 0; i < w*h; ++i){
	int in_index = i + hw(k + b*c);
	in_delta[in_index] += out_delta[out_index] / (w*h);
	}
	}

	extern "C" void forward_avgpool_layer_gpu(avgpool_layer layer, network net)
	{
	size_t n = layer.c*layer.batch;

	forward_avgpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.w, layer.h, layer.c, net.input_gpu, layer.output_gpu);
	check_error(cudaPeekAtLastError());
	}

	extern "C" void backward_avgpool_layer_gpu(avgpool_layer layer, network net)
	{
	size_t n = layer.c*layer.batch;

	backward_avgpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.w, layer.h, layer.c, net.delta_gpu, layer.delta_gpu);
	check_error(cudaPeekAtLastError());
	}