所有关于电路
消息

模拟功率在数字大小?边缘人工智能处理器结合了这两个世界的最佳

12月02日,2020年12月经过杰克赫兹

模拟计算能否成为解决边缘AI硬件面临的诸多挑战的可行方案?我们采访了Mythic的首席执行官迈克·亨利,看看他们为什么这么认为。

传统的处理架构在将人工智能推向边缘时并不能完全做到这一点。典型的von neumann架构而AI不良好,因为内存中的大量数据移动,以及高时钟速度,不利于低功耗,高性能AI处理。很多公司都有转向内存计算为解决方案,但问题仍然存在。

数据从内存移动到处理器的移动

数据从存储器移动到处理器所消耗的能量比计算本身多200倍。这对人工智能硬件构成了严峻的挑战。从图片冯石等。

AI加速公司神话采用了一种新的方法来解决这些问题:用模拟计算替换数字计算。我们采访了Mythic的首席执行官Mike Henry,以获取最新产品,M1108的详细信息,以及它们如何使用模拟计算将AI带到边缘。

具有类似数字足迹的模拟性能

模拟计算机可能听起来很陈旧,但事实证明,它们在传统的数字计算方面提供了很多好处。最为显着地,与数字计算机相比,模拟计算有潜力提供巨大的能量和性能节省。然而,模拟计算在很大程度上受到了历史上模拟存储元素非常大的限制,最终限制了速度和可扩展性。

M1108

M1108。图像使用的是神话礼貌

希望利用模拟计算的好处,同时避开内存问题,Mythic将嵌入式闪存与模拟计算相结合。

“现在我们拥有所有世界上最好的,”首席执行官迈克亨利评论。“我们得到了几十年所知的模拟计算的力量和性能。我们拥有闪存的存储和计算密度。这是Mythic在多年来建造的核心创新。”

将模拟计算与闪存相结合

神话公司称其最新产品为,M1108,该行业的第一个AI模拟矩阵处理器(AMP)

如前所述,该系统的工作原理是将真正的模拟内存计算与闪存的高内存密度相结合,提供8位片上存储器。

该芯片利用Mythic AMP,这是一个由112“瓷砖的数组组成的数据流架构。每个图块包含模拟计算引擎,数字SIMD矢量引擎,32位RISC-V纳米处理器,NOC路由器和本地SRAM。不需要外部DRAM。

神话的瓷砖建筑

神话的瓷砖建筑。图像使用的是神话礼貌

“传统上,原始向量矩阵计算是在模拟域处理的。其他一切都在数字领域处理,”Henry解释道。“我们把这两件事结合在一起,这是我们在过去8年里一直在完善的事情。”

平铺系统还提供了神话,能够非常容易地扩展或下降。蒂姆车辆,在神话中的产品和业务发展的SVP说:“缩放对我们来说很容易。如果我们想要运行更大的型号或更多型号,我们可以在PCI Express卡上添加更多芯片。如果我们想做一个较小的版本,我们可以做一个4 x 4阵列的瓷砖或3 x 3阵列的瓷砖。“

他补充一下,“有些方法可以通过添加筹码以向上时尚或缩小瓷砖的数量来击中较小的价格点和大小的方法来完成这款产品。”

Mythic的M1108:AI模拟在动作中计算

以这种方式合并模拟和数字域已经产生了一种产品,可在显着更小的功率,更小的尺寸和更低的成本下提供数据中心性能。

基于40nm CMOS工艺技术,该芯片支持INT4、INT8和INT16操作,同时也能够完全在芯片上运行单个或多个复杂的dnn,重量可达113M。

神话M1108 vs NVIDIA Xavier AGX

Mythic M1108与NVIDIA Xavier AGX。图像使用的是神话礼貌

M1108在以最高帧率运行ResNet-50时,显示了35个峰值,870帧每秒,功耗只有4瓦。与英伟达的Xavier AGX相比,M1108表现出了更好的性能、更低的功耗、更小的面积和更便宜的价格。

Edge Ai的模拟计算在这里

虽然模拟计算可能似乎已经过时,但Mythic声称已恢复它并用新的模拟矩阵处理器恢复它的全部潜力。将模拟计算与闪存相结合,该设备演示了一些令人印象深刻的规格,甚至与NVIDIA这样的数据中心Powershouses相比。

具有高性能,低功耗,低区域和高度可扩展的架构,Mythic的新M1108似乎很准备满足高端边缘AI应用的性能和价格挑战,如监控摄像机和视觉系统。在M1108上,亨利乐观报道,“这就是我们如何达到AI的承诺。”

Vehling补充道:“这可能是工程师们第一次真正利用模拟计算的能力。它来了,到了,而且效果很好。”