您的位置:首页 > 互联网

AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU_谷歌用ai设计芯片

发布时间:2024-09-27 20:16:53  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。

能设计芯片的AI黑科技来了!

就在刚刚,谷歌DeepMind推出名为AlphaChip的AI系统。

无论是设计最先进的用于构建AI模型的TPU,还是数据中心的CPU,它在相关的众多领域,都产生了广泛影响。

在谷歌的许多款芯片设计中,它都取得了出色的效果,比如Axion芯片(一种基于Arm 的通用数据中心CPU)。

AlphaChip设计芯片,用的是强化学习的原理。

也就是说,芯片布局设计对它来说是一种游戏,就像AlphaGo一样,它在游戏中,学习如何设计出最好的芯片布局。

几小时内,它就能生成超出人类水平,或是与人类专家相当的芯片布局了。

现在,它已经用于设计多代TPU芯片(TPU v5e、TPU v5p和Trillium)。而且跟人类专家相比,AlphaChip放置的块数越来越多,线长也减少了许多。

布局五年,谷歌多代TPU全由AI设计

其实谷歌对于这个AI,已经布局多年了。

早在2020年,团队就发表了一篇预印本论文,介绍了谷歌的全新强化学习方法,用于设计芯片布局。

论文地址:https://arxiv.org/pdf/2004.10746

后来在2021年,这项工作发表在了Nature上,并且进行了开源。

论文地址:https://www.nature.com/articles/s41586-021-03544-w

而自从首次发表这项工作以来,谷歌内部一直在对它进行改进。

今天,团队发表了Nature附录,详细描述了具体方法,及其对芯片设计领域的影响。

同时,他们还发布了一个预训练的检查点,分享了模型权重,公布模型名称为AlphaChip。

谷歌表示,AlphaChip是最早用于解决现实世界工问题的强化学习方法之一。

在数小时内,它就可以生成超人或类似的芯片布局,而不需要花费数周或数月的人类。它设计的芯片布局,已经被用于世界各地的芯片中,包括数据中心和移动电话。

为了设计TPU布局,AlphaChip首先在来自前几代的各种芯片模块上进行实践,例如片上和片间网络模块、内存控制器和数据传输缓冲区。这一过程被称为预训练。

然后,团队在当前的TPU模块上运行AlphaChip,以生成高质量的布局。

与之前的方法不同,AlphaChip在解决更多芯片布局任务时变得更好、更快,类似于人类专家的工作方式。

对于每一代新的TPU,包括谷歌最新的Trillium(第6代),AlphaChip都设计了更好的芯片布局,并提供了更多的总体布局图,从而加快了设计周期,产生了更高性能的芯片。

条形图显示了谷歌三代TPU上AlphaChip设计的芯片块的数量,包括v5e、v5p和Trillium

条形图显示,跟TPU物理设计团队生成的布局相比,AlphaChip在TPU三代产品中的平均有线长度减少

工作原理:一边设计,一边奖励

其实,设计芯片布局并不是一项简单的任务。

一般来说,计算机芯片有许多相互连接的模块、多层电路元件组成,所有这些部件都由纤细无比的导线连接起来。

此外,还有许多复杂且相互交织的设计约束,必须同时满足。

由于设计的复杂性,60多年来,芯片设计工程师一直在努力自动化芯片布局规划过程。

谷歌表示,AlphaChip的研发,从AlphaGo和AlphaZero中汲取了经验。

众所周知,通过深度学习和博弈论,AlphaGo和AlphaZero逐渐从0掌握了围棋、国际象棋和将棋的潜在规则。

AlphaChip同样是采用了,将芯片底层规划视为一种游戏的策略。

从空白栅格开始,AlphaChip每次放置一个电路元件,直至放置完所有元件。

然后,根据最终布局的质量,给予模型奖励。

谷歌芯片大神

一种全新的基于边的图神经网络让AlphaChip,能够学习相互连接的芯片元件之间的关系,并在芯片之间进行泛化,让AlphaChip在设计的每种布局中都有所改进。

左图:动画显示AlphaChip在没有任何经验的情况下,将开源的Ariane RISC-V CPU置入。右图:动画显示AlphaChip在对20个TPU相关设计进行练习后,放置相同的块。

AI大牛带队,2页浓缩版力作

让我们从最新论文中深扒一下,AlphaChip的整个训练过程。

值得一提的是,这项研究依旧是由Jeff Dean带队,所有核心要素全都浓缩在了这两页论文中。

论文地址:https://www.nature.com/articles/s41586-024-08032-5

预训练

与以往方法不同的是,AlphaChip是基于一种强化学习的方法。

谷歌用ai设计芯片

这意味着,当它解决了更多芯片布局问题的实例时,会变得更好、更快。

正如Nature论文(2021年),以及ISPD2022后续研究中所讨论的那样,这种预训练过程显著提升了AI的速度、可靠性、布局的性能。

顺便提一句,预训练也能培养出LLM,像Gemini、ChatGPT令人印象深刻的能力。

自此前研究发表以来,谷歌便开源了一个软件库,以重现论文中描述的方法。

开发者们可以使用这个库,对各种芯片进行预训练,然后将预训练的模型应用到新的块。

GitHub地址:https://github.com/google-research/circuit_training

基于最新的AlphaChip训练过程,研究人员在库中添加了预训练的20个TPU块模型检查点(checkpoint)。

显然,如果不进行任何预训练,AlphaChip就无法从先前的经验中学习,从而规避了学习方面的问题。

训练和计算资源

华为mate30 pro有鸿蒙系统吗

随着RL智能体(任何ML模型)的投入训练,它的损失通常会逐渐减少。

最终会趋于平稳,这代表着模型对其正在执行的任务有了尽可能多的了解,对外表现就是收敛。

从训练到收敛,是机器学习的标准做法。如果不按照这个路径来,可能会损害模型的性能。

AlphaChip的性能随应用的计算资源而扩展,在ISPD2022论文中,谷歌团队曾进一步探讨了这一特性。

论文地址:https://dl.acm.org/doi/10.1145/3505170.3511478

正如Nature论文中所描述的,在对特定块进行微调时,使用了16个工作单元,每个单元由1个GPU和32个RL环境组成,通过多进程处理共享10个CPU。

总言之,用较少的计算资源可能会损害性能,或者需要运行相当长的时间,才能实现相同(或更差)性能。

初始布局

在运行Nature论文中评估方法之前,团队使用了来自物理综合的近似初始布局,以解决hMETIS标准单元集群大小不平衡的问题。

RL智能体无权访问初始布局,并且不复杂放置标准单元。

尽管如此,谷歌作者还是进行了一项消融研究,排除了任何初始布局的使用,并且也没有观察到AlphaChip性能下降。

如下表1所示。

具体来说,他们跳过了单元集群重新平衡的一步,而是将hMETIS集群不平衡参数降低到最低设置(UBfactor =1)。

由此,这使得hMETIS生成更平衡的集群。

基准

在Nature论文中,研究人员采用了10nm以下制程的TPU块进行实验得出的结果。

这个技术节点的大小,正是现代芯片的典型尺寸。之前许多论文报告中,采用较早的45nm、12nm。

从物理设计角度来看,这种较老的技术节点尺寸的芯片,有着显著的不同。

比如,在10nm以下的芯片中,通常使用多重图案设计,这会在较低密度下导致布线拥堵的问题。

来源:Pushing Multiple Patterning in Sub-10nm: Are We Ready?

因此,对于较早的技术节点尺寸,AlphaChip可能需要调整其奖励函数,以便更好地适应技术。

展望未来:AI将改变整个芯片设计流程

自从2020年发布以来,AlphaChip已经生成了每一代谷歌TPU使用的超人芯片布局。

可以说,正是因为它,才能使大规模放大基于Transformer架构的AI模型成为可能。

无论是在Gemini这样的LLM,还是Imagen和Veo这样的图像和视频生成器中,TPU都位于谷歌强大的生成式AI系统的核心。

另外,这些AI加速器也处于谷歌AI服务的核心,外部用户可以通过谷歌云获得服务。

如今,谷歌的三代旗舰TPU芯片,已经在世界各地的数据中心中制造、部署。

随着每一代TPU的发展,AlphaChip和人类专家之间的性能差距不断扩大。

从TPU v5e中的10个RL放置模块和3.2%的布线长度减少,到TPU v5p中的15个模块和4.5%的减少,再到Trillium中的25个模块和6.2%的减少。

AlphaChip还为数据中心CPU(Axion)和谷歌尚未公布的其他芯片,生成了超越人类的布局设计。

而其他公司,也在谷歌研究的基础上进行了改进。

比如联发科就不仅用AlphaChip加速了最先进芯片的开发,还在功耗、性能和面积上对芯片做了优化。

如今,AlphaChip仅仅是一个开始。

谷歌对未来做出了大胆畅想:AI将实现芯片设计全流程的自动化,

通过超人算法以及硬件、软件和机器学习模型的端到端协同优化,芯片设计的周期会显著加快,还会解锁性能的新领域。

谷歌表示,非常期待和社区合作,实现AI芯片以及芯片AI之间的闭环。

参考资料:

https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

https://x.com/JeffDean/status/1839308592408834559


返回网站首页

本文评论
开源终端工具「终端厂商首个开源大模型AndesGPT位列OpenCompass中文7B规模第一」
据OpenCompass评测平台最新数据,OPPO大模型AndesGPT-7B以62. 2 的综合分位列中文数据集综合榜单中第五,在同为 70 亿(7B)规模参数下的大模型中排名第一。值得注意的是,OpenCompas...
日期:10-31
央视直播聚焦新华模式:职业教育须关注市场需求 培养应用型互联网人才
  2019年2月17日下午14:30,央视新闻直播间发起关于“毕业即就业!解析职业教育如何打造核心竞争力”的话题大讨论,聚焦就业,探讨互联网时代职业教育核心竞争力如何打造,直播期...
日期:08-26
代表建议直播账号日打赏额不超100元:网友分成两派_直播打赏限额标准
高额网络直播打赏的新闻时常见到,尤其是对涉世未深的青少年毒害极大,全国人大代表李君计划递交《关于加大对直播间赌博、打赏及网游、网贷等网络乱象整治力度》的建议,提出将每...
日期:03-04
一汽、比亚迪合资电池项目正式启动量产 首搭红旗新款纯电车型
【】4月8日消息,一汽弗迪官方宣布,近日,一汽弗迪新能源科技有限公司PA75动力总成电池项目量产启动仪式顺利举行。猿辅导对孩子管用吗一汽动力总成产品线CEO杜维明表示,PA75项目...
日期:04-08
大数据时代,可以从哪几个方面加强数据安全与隐私保护_大数据时代保护网络安全,有数据更要会用数据!
  今天几乎人人在讲大数据,每个企业都讲自己有大数据,但其实人们对大数据这三个字有很大的误解,“大”跟大小没有关系,“大”是大计算的意思,未来数据是重要的生产资料,而运用...
日期:09-04
远程审计 助力抗疫—用友推出远程审计信息化集成平台(远程联网审计)
  → 2018年:   “要坚持科技强审,加强审计信息化建设!”   →2019年:   审计署印发的《2019年度内部审计工作指导意见》要求:努力做到“一审多项”“一审多果”“一...
日期:08-06
立夏吃一蛋力气长一万!夏天模式开启:你那有什么习俗?
快科技5月6日消息,今天是我国二十四节气中的立夏”,这是夏季的第一个假期,代表着夏天就要来了。立夏后,日照增加,逐渐升温,雷雨增多,也是标示万物进入旺季生长的一个重要节气。不过...
日期:05-06
知情人:员工怒怼领导聊天记录疑伪造 网友:大家的共鸣是真的_领导诽谤员工,如何搜集证据怎么办
网络上引起广泛关注的“员工因强制加班怼领导”事件被证实与中国电科无关。事件发生在四川德阳经开区某科技公司,网传的聊天记录疑似是伪造的。据聊天记录显示,在微信群中,一个...
日期:04-07
米粉狂喜!小米6年心血结晶终于来了
据消息,小米创办人雷军近日透露,该公司历时7年研发完成的全新操作系统——澎湃OS已经成功面世。这款操作系统将为用户提供完整的人车家全生态体验。2021我想创业由海藻制成的...
日期:10-24
全程用iPhone拍摄:好莱坞大片《惊变28年》2025年6月北美上映_惊变28天百度百科
快科技9月22日消息,据《Wired》报道,导演丹尼博伊尔(Danny Boyle)执导的新片《惊变28年》(28 Years Later)将成为首部完全使用苹果iPhone拍摄的好莱坞大片。这部恐怖电影预算为750...
日期:09-24
极端50度高温来袭:印度一地44名选举工作人员被热死_印度高温已致36死
快科技6月3日消息,近日印度遭遇极端高温天气,首都新德里最高温度创纪录式地达到了52.9摄氏度,为有记录以来的最高气温,不过印度政府表示,由于温度传感器出现故障,这一数据有误,比实...
日期:06-03
IBM董事长兼首席执行官观点:如何推进可信的人工智_ibm领导
作者:Arvind Krishna,IBM 董事长兼首席执行官( 2023 年 9 月 27 日)人工智能(AI)不仅影响深远,且事关重大。预计到 2030 年,AI将提升人类生产力,带来高达 16 万亿美元的巨大价值...
日期:09-28
禾赛科技预计将于2月9日正式登陆纳斯达克「禾赛科技预计将于2月9日正式登陆纳斯达克上市」
凤凰网科技讯 2月8日消息,据IPO Boutique消息,禾赛科技预计将于2月9日(周四)正式登陆纳斯达克。360f4充电器瞳仁之家眼镜刘强东绝对控制京东360儿童卫士3代上海禾赛科技股份有限...
日期:02-09
iPhone16系列新增相机按钮AI功能 可根据个人喜好配置功能_ios15相机新功能怎么使用
9月10日 消息:苹果公司今日宣布推出新款智能手机iPhone16和iPhone16Plus,这两款设备专为搭载苹果智能技术而设计。iPhone16配备了一个位于设备侧面的全新电容式按钮,名为“Cam...
日期:09-10
十分刺激!美一架波音737客机飞行途中引擎喷火:紧急返航「波音737起飞视频」
8月18日消息,正坐着飞机前往目的地,扭头一看,好家伙,飞机引擎竟然在冒火,如果是你遇到这种情况,第一反应会是什么呢?据美联社报道,当地时间本月15日,一架航班号307的波音737客机在起...
日期:08-18
Kindle生错了时代?也许是我们辜负了阅读「kindle 出错了」
Kindle电子书。视觉中国 资料图早在去年,亚马逊就已宣布将于2023年6月30日起在中国停止Kindle电子书店的运营。5月31日,亚马逊发布公告,解答Kindle中国电子书店运营停止的相关...
日期:06-02
抖音婚纱照特效「AI视野:抖音网友被自己的AI婚纱照美晕;Midjourney 局部重绘功能来袭」
1、 抖音网友被自己的AI婚纱照美晕了最近,“AI婚纱照”特效在抖音走红,不少用户纷纷表示被自己美晕。其中,抖音博主“盛以婕”发布的一条视频“被自己穿婚纱的样子惊艳到了”,用...
日期:08-23
CES Asia 落幕,从科大讯飞产品看出这些趋势
  6月13日,为期三天的CES Asia 2019落幕。在今年的CES Asia上,5G、人工智能等成为大热名词。人工智能被称为第四次工业革命的重要推动力,而技术的发展,最终还是要落实到应用...
日期:08-11
2023年全球WLAN市场收入100亿美元 创历史新高_中国wlan市场占有率排名
根据市场研究公司Dell’Oro Group的最新报告,随着新的供应涌入市场,今年WLAN市场预计将再增长11%,达到创纪录的100亿美元。与此同时,中国制造商已经跃至Wi-Fi 7,并已在其主要客户...
日期:08-03
Omdia:微型LED显示面板市场规模2030年将增长到5170万台_小型led电子显示屏
Omdia的一项新研究发现,到2030年,微型发光二极管(Micro LED)显示面板的出货量预计将增长到5170万台。然而,在预测期内,由于该技术仅在有限的应用中具有竞争力,Micro LED显示面板的...
日期:09-20