深圳幻海软件技术有限公司 欢迎您!

  • 单核M1 CPU上实现FP32 1.5 TFlops算力?这是一份代码指南

    ​1.5TFlops到底有何魅力?首先,这是在电池供电的单核MacBookAir2020上运行;其次,这会以每条指令约0.5纳秒的延迟运行。那些强大的加速器或GPU张量核不在我们的考虑范畴。我们这里讨论的是与CPU寄存器相隔一个周期的实际线性代数性能。奇怪的是,苹果一直在向我们隐瞒这一点。在本文中,

推荐阅读