巨量的数据,巨量的连接,巨量的算力,我们该用什么样的架构来满足处理需求?

作者:电子创新网张国斌

在数字化大潮下,地球上每天都通过手机、PC、汽车、工厂等产生大量的数据,要将这些数据深度挖掘出价值,需要海量的处理器以及海量的资金和电力,有没有其他架构来满足这些需求?

在8月28日召开的第三届滴水湖中国RISC-V产业论坛上,加拿大独角兽公司Tenstorrent首席CPU构架师练维汉发表主题演讲,详细分析了RISC-V为何火爆,并如何在未来20年成为处理器热门架构的原因,同时,他还分分享了Tenstorrent未来处理器发展规划。

1.jpg

“我们大家都知道爱因斯坦,爱因斯坦晚年一直在追求一个理论——统一理论。统一理论为什么产生?是因为它既可以解释宇宙大事件,又可以解释微电子现象。而它们两个常常是有冲突的,所以爱因斯坦想要聚焦这个东西。”练维汉表示,“我们现在看到的AI、处理器等很多架构,作为架构师、我们的想法是:在这么多、这么复杂的应用场景之下,是否可以找到一个统一方案来解决这所有的问题。统一的东西,可以让我们做出来的产品都可以运用?我今天就要跟各位分享这个。”

2.jpg

他表示Digital正在改变着世界,AI带给人类最重要的是什么?现在让你使用的东西都可以因为你而“最佳化”,你可以享受到专门为你量身定做的东西。这样的东西在以前是没有可能的,因为没有那样的算力可以到达为你量身定做任何一样的事情。

3.jpg

这需要巨量的计算!在处理器发明以后,数字处理每年以两倍的速度翻倍。从1997年个人PC时代开始到2007年iPhone出现,然后随着通信技术的发展,我们每天拿着手机产生大量的数据,巨量的Data每天被产生,要了解这些资讯、找出里面的有价值数据,如果把每天人类产生的数据进行处理和存储,如果把所有的数据转换成ChatGPT结果,要花一千亿美金。然后,电力要增加20倍。

4.jpg

要处理巨量的数据,我们的看到:计算必须要在每一个地方发生。例如:人类是一个非常复杂的生物机器,如果所有碰触到你皮肤的数据都要传递到大脑做决定是不可能的事。如果这样的话,你的神经可能要比现在宽多少倍都不知道。很多触觉上的东西在皮肤层就做了筛选,有用的讯息才会传递到大脑。在生物学上基本上告诉你已经不可能了,所以在实践上面要把所有的计算都放到云端算了再传回来这是一件不可能的事情。

“所以我们在想这件事情,就是说:计算必须要在每一个地方发生,然后你才能够达到你所要的功效需求和传输的需求。你们都知道人类的大脑事实上是全世界最复杂的一个处理系统,假如要跟现在的计算相比、人类好像是1万倍吧。所以说你基本上是不可能把所有的东西传到云端算了再放回来,所以可能要放在你的IoT上面、放在你的机器上面,到处都需要有这个计算。”他指出。

5.jpg

有这样的一个需求以后,我们需要Heterogeneity。还有就是要能够可扩充性,你发明的东西不能用在一个点、要用在从最简单的到最复杂的东西。就像爱因斯坦希望用一个理论来解释宇宙所有的现象,我们也希望一个解决方案可以通用到所有的事情上面去。还有就是你也不能让它太复杂,我们常常做架构经常问的一个问题,就是说:你做的这个东西是不是足够的简单,是不是去无从轻到最高极限、最简单的东西去解决同样一个问题。我们永远寻求的最终解决方案,永远是要找到最精简的东西来解决同样的一个问题。精简有什么好处?容易实现。以后做变动的时候等等,都有很多的好处。

 “为什么RISC-V很适合这个东西?因为它是一个Open-source。我们的好处就是说,我做了一个架构、不需要跟ARM说:“我可不可以做这样,可不可以做那样。”有非常大的弹性,这是指令集给你的一个方便的东西。我为什么认为这个东西一定会起来?就是基于这个考量。因为以后的Compute是非常复杂的,你需要一个指令集能够让你做这样的事情。RISC-V就是一个很好的“点”。”他总结说。

6.jpg

他还分享了Tenstorrent的产品规划,Tenstorrent的Scalable AI 架构可以把它变成一个大的系统,然后变成一个晶片之后又可以放到更大的系统里面。Tenstorrent的软件系统可以帮客户聚焦需求,把一个到几万个晶片金融和在一起。

不过AI的演化非常快,所以AI要设计的足够有弹性、才可以去应付未来AI方案的需求。Tenstorrent开发了一种  Scalable RISC-V processor ,可以实现可扩展性。

7.jpg

8.jpg

9.jpg

如上图所示,Tenstorrent的Tensix内核里其实有5个RISC-V处理器,可以完成发送、接收和计算功能,“我们希望这个要具有很强的可扩展性。为什么要放CPU在里面?因为我们预测未来AI的运算CPU还是会占一个很重要的地位。所以它在两个不同算力的东西在一起的时候,我们有几种很多的考虑,通过Chiplet适应不同的处理器场景。”他指出,“把AI拿掉就可以跟AMD做PK。所以它是一个很好的、让你很有弹性设计你的系统架构。”

10.png

11.png

12.png

针对不同的应用,Tenstorrent也推出了优化的方案。如针对穿戴、移动、汽车领域的处理器等。

13.png

14.png

15.png

16.png

17.png

18.png

19.png

从可扩展架构来看,我们的看法是:巨量的Data、巨量的AI需要需要计算无处不在,计算无处不在不能用太复杂的执行架构,我个人觉得这是一个非常有前景的事情。大家要看到这个历史浪潮,我觉得未来十年、二十年可能是芯片的黄金时代。因为在算力方面,我现在没有看到任何解决方案来解决这个事情,所以这是巨大的产业、巨大的机会!我希望跟在座的各位做合作。

最新文章