半岛彩票英伟达市值在2024年实现了显著增长,累计增加达1万亿美元,因此其在标准普尔500指数中的表现尤为出色,成为该指数中表现最佳的股票。
近日,英伟达在硅谷的圣何塞会议中心隆重举办了2024年度的AI大会GTC,被视为今年AI行业发展的风向标。
英伟达全新推出的GPU平台Blackwell,兼容Hopper的普通系统以及连接Grace CPU的专用系统。
该平台催生了B200芯片,其晶体管数量高达2080亿,远超H100的800亿。
这一显著增长意味着B200芯片具有强大的并行计算能力,英伟达宣称其为全球领先的人工智能芯片。
B200能够在十万亿级参数模型上实现高效的AI训练和实时的LLM(大语言模型)推理。
B200由两个超大型Die(裸片)封装组合而成,内含超过2080亿个晶体管,较前一代的800亿个晶体管数量翻了一番。
此外,整块芯片还封装有192GB高速HBM3e显存,以满足高性能计算的需求。
与H00芯片相比,GB200为大模型推理负载提供了30倍的性能提升,同时降低了25%的成本和能耗。
与相同数量的英伟达H100 Tensor Core GPU相比,GB200 NVL72在LLM推理工作负载方面的性能最多可提升30倍,成本和能耗最多可降低25倍。
此外,英伟达还发布了基于GB200的DGX Super Pod一站式AI超算解决方案。
其FP4精度计算性能高达每秒11.5百亿亿次,相比上一代产品,推理性能提升30倍,训练性能提升4倍。
这一转变源于B200所采用的台积电改进版N4P工艺,在晶体管密度上并未实现显著突破。
与此同时,H100芯片已接近其理论最大尺寸。因此,采用双芯片设计似乎是一种合理的选择。
Blackwell是一款专为数据中心设计的先进芯片平台,针对当前热门的AI大模型进行优化,显著提升了训练和推理性能以及能效。
与英伟达的Grace CPU和新一代网络芯片等产品相结合,Blackwell共同构成了一个完整的生成式AI解决方案。
基于该平台,英伟达衍生出了包括GPU、AI超级芯片、服务器、大型计算集群和云服务在内的多套解决方案,为用户提供全方位的技术支持。
在训练方面,Blackwell架构展示了显著效率。以往90天内,训练一个1.8万亿参数规模的模型需要8000个Hopper架构的GPU,并消耗15兆瓦的功率。
而现在,仅需2000个Blackwell架构的GPU,功率降低至4兆瓦,即可在相同时间内完成任务。
在推理领域,Blackwell架构的芯片性能是先前Hopper架构芯片的30倍。
该引擎通过为每个神经元使用4位而不是8位,实现了计算、带宽和模型大小的两倍提升。
同时,配备的第五代NVLink技术为每个GPU提供了1.8TB/s的双向吞吐量,确保了多达576个GPU之间的无缝高速通信。
目前,亚马逊云科技、戴尔科技、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉和xAI等知名企业已计划采用Blackwell产品,以推动其AI技术和应用的进一步发展。
英伟达在达到上一个万亿市值的过程中,主要得益于其在GPU与算力领域的卓越表现。展望未来,公司预测机器人开发领域将成为其市值增长的新动力。
今年初,英伟达资深科学家Jim Fan宣布成立GEAR工作室,其研究成果和研究环境为英伟达的新机器人解决方案奠定了坚实的基础。
英伟达近期发布了名为Project GR00T的人形机器人基础模型。这一模型具备通用性,可以作为机器人的核心处理器,使机器人具备学习和执行各种任务的能力。
通过语言、视频和人类演示,GR00T能够理解自然语言,模仿人类动作,并快速学习协调性、灵活性以及其他技能,从而与现实世界融合并与人类进行互动。
新推出的Jetson Thor人形机器人计算机,基于Thor芯片,能够执行复杂任务并处理多个传感器数据。
该计算机具备每秒800万亿次8位浮点运算的AI性能,可以运行GR00T等多模态生成式AI模型,并简化设计和集成流程。
英伟达正在构建三大平台——IAI、Omniverse和ISAAC,这些平台均与机器人产业紧密相关。
IAI搭载DGX系列产品,用于模拟物理世界;Omniverse搭载RTX和OVX系列产品,驱动数字孪生的计算系统;而ISAAC则搭载AGX系列,驱动人工智能机器人。
同时,ISAAC Lab整合了ISAAC MANIPULATOR加速库平台和ISAAC PERCEPTOR软件库,分别用于提升机械臂的灵敏度和精确度以及服务机器人的感知能力。
在黄仁勋看来,英伟达站在计算科学和物理等一切科学的交叉点,成为新工业革命的引擎。
除了硬件系统,英伟达也利用生成式 AI 构建了一系列元宇宙、工业数字孪生、机器人训练软件体系。