gemv是我接触的第一个cublas function,然而由于cublas中矩阵是按列保存的,所以对于一个$ m*n$的按行保存的矩阵$A$,调用的正确姿势是
|
|
可能是按列储存的原因,cublas的gemv效率相比于自己手写的kernel低不少,但是自己手写的kernel和cublas的可能有一定的精度差异
gemv是我接触的第一个cublas function,然而由于cublas中矩阵是按列保存的,所以对于一个$ m*n$的按行保存的矩阵$A$,调用的正确姿势是
|
|
可能是按列储存的原因,cublas的gemv效率相比于自己手写的kernel低不少,但是自己手写的kernel和cublas的可能有一定的精度差异