在上期视频中,我简单介绍了 compute-bounded 和 memory-bounded 算法的区别,并具体提到了一个被 compute-bounded 的算法:GEMM。
在这期视频中,我们将着手优化这个算法,让它提速120倍!
我的GitHub主页:https://github.com/fangjunzhou
本期视频中使用的代码:https://github.com/fangjunzhou/blas-playground
Motion Canvas 官方repository:https://github.com/motion-canvas/motion-canvas
我使用的 Motion Canvas custom fork:https://github.com/fangjunzhou/motion-canvas