跳到主要内容

Triton IR

流程:

Python AST → Triton IR → Triton GPU IR → LLVM IR → PTX → SASS

代码:

运行:

conda activate triton
python3 frameworks/triton/debug/vecadd_ir.py

输出:

编译阶段对应文件核心作用关键信息/优化
Python AST01_source.txt解析 Python 语法树控制流结构、变量作用域、函数定义
Triton IR
(Triton Dialect)
02_ttir.mlir平台无关的高级 IR块级并行、张量操作、内存访问模式
Triton GPU IR
(TritonGPU Dialect)
03_ttgir.mlirGPU 特定优化线程布局;内存层级、向量化、合并访问
LLVM IR04_llir.ll低级虚拟机器码寄存器分配、指令选择、平台无关优化
PTX
(Parallel Thread Execution)
05_ptx.ptxNVIDIA 汇编中间表示线程级指令、寄存器使用、内存访问指令
SASS/CUBIN
(Shader Assembly)
06_cubin.cubin最终 GPU 机器码二进制可执行代码、资源占用、启动配置