kernels-community
/

relu

drbh HF Staff commited on Jan 26

Commit

f3b474c

verified ·

1 Parent(s): 021b089

Update benchmarks/benchmark.py

Files changed (1) hide show

benchmarks/benchmark.py CHANGED Viewed

@@ -4,11 +4,20 @@ import torch.nn.functional as F
 from kernels.benchmark import Benchmark
 class ReluBenchmark(Benchmark):
     seed: int = 42
     def setup(self):
-        self.x = torch.randn(1024, 1024, device="cuda", dtype=torch.float32)
         self.out = torch.empty_like(self.x)
     def benchmark_base(self):
@@ -18,7 +27,8 @@ class ReluBenchmark(Benchmark):
         return F.relu(self.x)
     def setup_large(self):
-        self.x = torch.randn(4096, 4096, device="cuda", dtype=torch.float32)
         self.out = torch.empty_like(self.x)
     def benchmark_large(self):

 from kernels.benchmark import Benchmark
+def get_device():
+    if torch.cuda.is_available():
+        return "cuda"
+    elif torch.backends.mps.is_available():
+        return "mps"
+    return "cpu"
 class ReluBenchmark(Benchmark):
     seed: int = 42
     def setup(self):
+        device = get_device()
+        self.x = torch.randn(1024, 1024, device=device, dtype=torch.float32)
         self.out = torch.empty_like(self.x)
     def benchmark_base(self):
         return F.relu(self.x)
     def setup_large(self):
+        device = get_device()
+        self.x = torch.randn(4096, 4096, device=device, dtype=torch.float32)
         self.out = torch.empty_like(self.x)
     def benchmark_large(self):