Triton 算子开发

官方教程

环境确认，运行向量加法，见 01_vecadd.py：

conda activate triton
python3 frameworks/triton/tutorials/01_vecadd.py

动手实现一下 GEMM 来学相关概念吧。

GEMM (General Matrix Multiplication) 指通用矩阵乘法，即 matmul（Matrix Multiplication）。

Triton GEMM 官方实现，见 03_matmul.py：

python3 frameworks/triton/tutorials/03_matmul.py

其用了 @triton.autotune，性能接近 cuBLAS。

Triton GEMM 用 AI 写的示例，见 gemm_demo.py：

python3 frameworks/triton/gemm/gemm_demo.py

其清晰展示了上述几个关键概念，用于教学。

代码：

运行：

python3 frameworks/triton/gemm/gemm_01_jit.py

代码：

运行：

python3 frameworks/triton/gemm/gemm_02_blk.py

代码：

运行：

python3 frameworks/triton/gemm/gemm_03_fusion.py