目录

AI-学习笔记

AI 学习笔记

根据算力(TOPS)估算推理速度

如果已知模型的计算需求(FLOPs)和硬件算力(TOPS),可以用以下公式估算 最大可能的推理速度

https://i-blog.csdnimg.cn/direct/bfb23a2378494114968ab66ec73aecf3.png

FLOPs 是指模型运行一次推理,需要的浮点运算计算次数。注意和FLOPS(大写S)的区别,它表示每秒执行的浮点运算次数。