英伟达用 AI 设计 GPU:最新 H100 已经用上,比传统 EDA 减少 25% 芯片面积
感谢小编网友 极光星夜 的线索投递!
英伟达终于揭晓:H100 竟有近 13000 条电路,是 AI 设计的?!
在最新论文中,他们介绍了如何用深度强化学习 agent 设计电路的方法。据研究人员称,这种方法还属业内首次。
值得一提的是,这篇文章包含参考文献在内,仅有短短 6 页。不少网友表示,太酷了!
靠玩游戏来学习构建电路架
随着摩尔定律变慢,开发其他技术来提高芯片性能变得愈发重要。设计更小、更快、功耗更低的算术电路,就是其中的方式之一。基于这样的背景,研究人员提出了 PrefixRL—— 用深度强化学习优化并行前缀电路。
据研究人员介绍,他们不仅证明了 AI 可以从头开始设计电路,而且比 EDA 工具设计得更小、更快。
最新英伟达 Hopper 架构就拥有 13000 个 AI 设计电路的实例。来具体看看这项研究。
本文主要研究了一种流行的并行前缀电路,着重讨论了电路的两大特性:电路面积和延迟。已有的优化基本思路,是使用电路发生器将前缀图形转换为带有导线和逻辑门的电路,再用物理综合工具进一步优化。他们将算术电路设计看作是一个强化学习任务,训练一个 agent 来优化两大特性。对于前缀电路,还设计了一个环境。
在这个环境中 agent 玩构建电路架构(前缀图形)的游戏,可以从中添加 or 删除节点,会因为电路面积最小化和低延迟而获得奖励。
研究人员使用 Q-Learning 算法来训练 agent。首先将前缀图表示成网格,网格中的每个元素都映射到电路中的节点。输入和输出均为网格,只不过输入网格中的每个元素表示节点是否存在,输出每个元素则表示用于添加或删除节点的 Q 值。
在实际训练中,PrefixRL 是一项计算要求很高的任务:物理模拟每个 GPU 需要 256 个 CPU,训练 64b 用例花费超 32000 个 GPU 小时。为此,研究人员还开发了个分布式强化学习训练平台 Raptor。
结果显示,在相同延迟、效能下 PrefixRL 加法器面积比 EDA 工具加法器面积减少了 25%。
研究团队
本次研究来自英伟达应用深度学习研究小组。他们希望这个方法有希望让 AI 应用到实际电路设计问题当中去。
近年来,AI 设计芯片这件事儿很多科技公司都已经在展开。最典型如谷歌,去年 6 月在 Nature 上发表了一篇文章:A graph placement methodology for fast chip design。文中表示,AI 能在 6 个小时内生成芯片设计图,而且比人类设计得更好。
还有像三星、新思、cadence 等企业也都有相应的解决方案。
前阵子在英伟达 GTC 大会上,首席科学家、计算机架构大师 Bill Dally 就分享了 AI 在芯片设计上的几种应用。包括预测电压降、预测寄生参数、布局布线、自动化标准单元迁移。
不过,即便进展频频,也有不少质疑的声音出现,比如,设计能力跟人类比还差点。对于 AI 设计芯片这事儿,你怎么看?
参考链接:
[1]https://developer.nvidia.com/blog/designing-arithmetic-circuits-with-deep-reinforcement-learning/
[2]https://arxiv.org/pdf/2205.07000.pdf
[3]https://twitter.com/rjrshr/status/1545446397759016962
[4]https://www.hpcwire.com/2022/04/18/nvidia-rd-chief-on-how-ai-is-improving-chip-design/
相关文章
- NVIDIA发布555.99版显卡驱动!支持《艾尔登法环:黄金树幽影》
- NVIDIA发布555.85版显卡驱动!支持《地狱之刃 2》《F1 24》等游戏
- NVIDIA发布552.44显卡驱动!支持《对马岛之魂:导演剪辑版》
- 人工智能芯片性能与功率效率,高通战胜英伟达成最大赢家
- 英伟达发布474.30驱动更新,修复多个安全漏洞
- 爆料称英伟达RTX 4060 Ti显卡发布时间确定
- 英伟达或将推出新款RTX显卡 加速人工智能技术发展
- 英伟达首席技术官:加密货币对社会无益,人工智能更有价值
- 2023 款戴尔 XPS 15/17 笔记本发布,升级英特尔 13代酷睿处理器和英伟达 40 系显卡
- 韩国加入人工智能竞赛,Rebellions 推出功耗只有英伟达 A100 约 20% 的 AI 芯片
- 英伟达 GeForce RTX 4070 桌面显卡曝光:GPU 主频可达 2475 MHz
- 英伟达展示RTX 4080移动显卡:能耗大幅降低 远超前代旗舰
- 元宇宙中的生产制造,奔驰利用英伟达 Omniverse 构建下一代工厂
- 英伟达发布 RTX Enterprise R525 驱动,支持最新工作站显卡 RTX 6000
- 承诺更新至 2024 年 9 月,英伟达为 Kepler 显卡发布 WHQL 认证驱动更新 474.14
- 消息称英伟达 2 月初发布 RTX 4090/4080 笔记本 GPU
系统下载排行榜71011xp
番茄花园Win7 64位推荐旗舰版 V2021.05
2深度技术Win7 64位豪华旗舰版 V2021.07
3番茄花园Win7 64位旗舰激活版 V2021.07
4带USB3.0驱动Win7镜像 V2021
5系统之家 Ghost Win7 64位 旗舰激活版 V2021.11
6萝卜家园Win7 64位旗舰纯净版 V2021.08
7技术员联盟Win7 64位旗舰激活版 V2021.09
8雨林木风Win7 SP1 64位旗舰版 V2021.05
9萝卜家园Ghost Win7 64位极速装机版 V2021.04
10技术员联盟Win7 64位完美装机版 V2021.04
深度技术Win10 64位优化专业版 V2021.06
2深度技术Win10系统 最新精简版 V2021.09
3Win10超级精简版 V2021
4Win10完整版原版镜像 V2021
5风林火山Win10 21H1 64位专业版 V2021.06
6Win10光盘镜像文件 V2021
7深度技术 Ghost Win10 64位 专业稳定版 V2021.11
8技术员联盟Ghost Win10 64位正式版 V2021.10
9Win10 21H1 Build 19043.1320 官方正式版
10技术员联盟Win10 64位永久激活版镜像 V2021.07
系统之家 Ghost Win11 64位 官方正式版 V2021.11
2Win11PE网络纯净版 V2021
3系统之家Ghost Win11 64位专业版 V2021.10
4Win11官网纯净版 V2021.10
5Win11 RTM版镜像 V2021
6番茄花园Win11系统64位 V2021.09 极速专业版
7Win11专业版原版镜像ISO V2021
8Win11官方中文正式版 V2021
9Win11 22494.1000预览版 V2021.11
10番茄花园Win11 64位极速优化版 V2021.08
深度技术Windows XP SP3 稳定专业版 V2021.08
2雨林木风Ghost XP Sp3纯净版 V2021.08
3萝卜家园WindowsXP Sp3专业版 V2021.06
4雨林木风WindowsXP Sp3专业版 V2021.06
5风林火山Ghost XP Sp3纯净版 V2021.08
6技术员联盟Windows XP SP3极速专业版 V2021.07
7萝卜家园 Windows Sp3 XP 经典版 V2021.04
8番茄花园WindowsXP Sp3专业版 V2021.05
9电脑公司WindowsXP Sp3专业版 V2021.05
10番茄花园 GHOST XP SP3 纯净专业版 V2021.03
热门教程 更多+
装机必备 更多+
重装教程 更多+
电脑教程专题 更多+