-
生成式扩散模型采样方法DDIM及其推导
记录学习DDIM采样方法的过程
-
生成式扩散模型DDPM及其推导
把学习扩散模型DDPM的过程记录一下
-
旋转位置编码
整理旋转位置编码相关的内容,介绍其来源及具体的算法
-
Attention系列整理Part2-FlashAttention
整理FlashAttention系列以及其计算原理
-
Attention系列整理Part1-基础
整理Attention的基础知识,推导计算量
-
关于SM Occupancy的一些解释说明
解释SM Occupancy的计算和意义
-
ByteTransformer源码解读
记录学习ByteTransformer过程中的代码释疑