NVIDIA 的 CUDA 生态一直是 GPU 计算的最大护城河。想用 AMD 显卡跑 AI?先把代码全部重写。 BarraCUDA 打破了这个局面:一个纯 C99 编写的开源编译器,零 LLVM 依赖,直接把 .cu 文件编译成 AMD RDNA 3 的机器码。 15000 行代码,支持共享内存、原子操作、线程同步、模板、半精度浮点,每条指令编码经 LLVM 反汇编验证,零解码失败。 追新不盲从,实测出真知 🔥 #CUDA #AMD #GPU #开源编译器 #AI基础设施 #BarraCUDA
www.bilibili.com