kernels-community
/

relu

Model card Files Files and versions

drbh HF Staff commited on Jan 26

Commit

021b089

·

verified ·

1 Parent(s): 20ffcb1

Upload benchmark.py

Files changed (1) hide show

benchmarks/benchmark.py +29 -0

benchmarks/benchmark.py ADDED Viewed

	@@ -0,0 +1,29 @@

+import torch
+import torch.nn.functional as F
+from kernels.benchmark import Benchmark
+class ReluBenchmark(Benchmark):
+    seed: int = 42
+    def setup(self):
+        self.x = torch.randn(1024, 1024, device="cuda", dtype=torch.float32)
+        self.out = torch.empty_like(self.x)
+    def benchmark_base(self):
+        self.out = self.kernel.relu(self.x)
+    def verify_base(self) -> torch.Tensor:
+        return F.relu(self.x)
+    def setup_large(self):
+        self.x = torch.randn(4096, 4096, device="cuda", dtype=torch.float32)
+        self.out = torch.empty_like(self.x)
+    def benchmark_large(self):
+        self.out = self.kernel.relu(self.x)
+    def verify_large(self) -> torch.Tensor:
+        return F.relu(self.x)