-
旋转位置编码
整理旋转位置编码相关的内容,介绍其来源及具体的算法
-
Attention系列整理Part2-FlashAttention
整理FlashAttention系列以及其计算原理
-
Attention系列整理Part1-基础
整理Attention的基础知识,推导计算量
-
关于SM Occupancy的一些解释说明
解释SM Occupancy的计算和意义
-
ByteTransformer源码解读
记录学习ByteTransformer过程中的代码释疑
整理旋转位置编码相关的内容,介绍其来源及具体的算法
整理FlashAttention系列以及其计算原理
整理Attention的基础知识,推导计算量
解释SM Occupancy的计算和意义
记录学习ByteTransformer过程中的代码释疑