OpenCL Backend: Broadcast/Reduce Ops

artyom-beilis November 5, 2021, 2:30pm 3

Yes I’ve seen it. But there is a small but critical difference.

Unlike cuda or CPU code that is compiled in-advance using templates, the OpenCL code is generated and compiled on demand. Which makes it simpler to maintain.

It is relevant to this discussion:

Topic		Replies	Views
Implementing OpenCL backend for pytorch hardware-backends	14	17011	March 1, 2024
OpenCL backend dev - questions/support hardware-backends	4	535	August 29, 2024
CUDA loops case study: code generation vs templates performance	4	2660	December 12, 2021
OpenCL Backend - Important Updates hardware-backends	18	8078	May 23, 2025
Why so many HW backend and nobody cooperate? hardware-backends	6	887	September 17, 2024

OpenCL Backend: Broadcast/Reduce Ops

Related topics