开云体网官网专注于注塑加工,塑料加工,青岛注塑加工,青岛塑料加工,塑料注塑模具等.

25年专注于模具研发、设计、加工

联系我们

  • 地 址:青岛市青大工业园棘洪滩街道河南头社区河南头路18号
  • 联 系 人:王经理
  • 电 话:0532-66020828
  • 手 机:18661680338
  • 邮 箱:wangmiaotian8@163.com
  • 网 址:www.0901w.com

不只5090英伟达还发布了最小的“AI超算”与最大的世界模型


来源:开云体网官网
发布时间:2025-03-10 23:20:57
还有人比英伟达的创始人黄仁勋,更适合做 2025 年 CES 的开幕主讲人吗? 作为标

雪昱模具加工中心

  还有人比英伟达的创始人黄仁勋,更适合做 2025 年 CES 的开幕主讲人吗?

  作为标志着 CES2025 正式揭幕的活动,黄仁勋的主题演讲从一开始就是点燃众人期待的开年盛事。

  当地时间 1 月 6 日,黄仁勋换了一身闪亮的蛇皮夹克——而不是他经常在发布会上穿的那件标志性夹克。「我夹克怎么样?」老黄在开场就用这身皮衣和人们开起了玩笑。

  毕竟,这里是赌城拉斯维加斯,不「浮夸」一些都是对 CES 举办地的不尊重。

  黄仁勋身上闪亮的皮衣,既代表了英伟达今年夸张的市值表现,同样意味着当晚的开场演讲中,他将发布一系列炸裂的产品。

  如果你认为 RTX 5090 这样的新「核弹」是老黄演讲的重心,那显然看轻了当晚的发布会。英伟达早慢慢的变成了 AI 行业的「兵工厂」,发布会上黄仁勋不仅公布了 Omniverse+Cosmos 这样立足于物理世界的 AI 模型和整套生产流程,同时还曝光了一款仍未定名的桌面级 AI 超算「Project Digits」。

  虽然经受着来自 AMD 的压力,但在经历数月的传闻后,英伟达终于在 CES 2025 上正式对外发布了下一代 RTX Blackwell GPU 系列,共包括四款型号:

  得益于新架构 Blackwell 和 DLSS 4,RTX 5090 的性能据称比 RTX 4090 快两倍。不过功耗也增加了 125 瓦,但英伟达表示其效率更加高,只有在满负荷时才会达到 575 瓦。

  RTX50 系列性能相比 40 系列均有「翻倍」的提升|图片来自:英伟达

  但这个「翻倍」的性能提升中,新一代支持多帧生成的 DLSS 4 技术同样功不可没,它能在传统渲染的基础上生成最多 3 个额外帧,帧率可提升高达 8 倍。同时利用生成式 AI 提升材质压缩与游戏角色面部质量。

  DLSS 4 还应用了实时 Transformer 模型,可改进图像质量、减少拖影并在动态画面中提供更高细节。DLSS 4 的部分升级也将适配现有的 RTX GPU。

  除了桌面级显卡系列,英伟达还将在笔记本电脑上推出 RTX50 系列 GPU,将于 3 月起由多家 PC 制造商发布产品登场。

  当然也不能忘记针对中国市场的 RTX5090D 版本:从目前英伟达官网公开的信息来看,RTX5090D 在主要在 AI 算力上进行了削减,别的部分的性能没有改变。

  除了 RTX5090 系列显卡,支撑起英伟达股价暴涨的,还有英伟达在世界模型领域的进展。

  在主题演讲中,黄仁勋介绍了名为 Cosmos 的一系列世界基础模型:这些模型能够预测并生成「物理感知」(physics-aware)的视频,其目的是未解决当前 AI 模型「知其然不知其所以然」的问题。

  这些模型参数规模从 40 亿到 140 亿不等,Nano 是最小的模型,Ultra 是最大的。虽然参数越多性能通常越好,但开发者仍然可根据具体应用进行微调,并可通过英伟达的 API 和 NGC 目录、GitHub 以及 Hugging Face AI 开发平台获取。

  据黄仁勋在演讲中介绍,这些模型基于 9000 万亿个标记(tokens)和 2000 万小时的真实世界人机交互、环境、工业、机器人及驾驶数据训练而成,但并未透露这些学习数据的具体来源:此前已经有报道表示这一些数据来源是 YouTube 视频。

  对此,英伟达只是表示「使用的数据来自多种公共和私人来源,这些都符合法律规定」。

  回到世界模型本身,有了海量的现实世界视频数据作为支撑,Cosmos WFM 模型可以依据文本或视频帧生成「可控的高质量」合成数据,用于机器人、无人驾驶汽车等领域的模型训练和开发。

  Cosmos 能够基于物理定律,输出合理的图像用于训练机器人|图片来自:英伟达

  虽然与传统意义上的「开源模型」有些偏差,但英伟达还是允许无论公司规模如何,研究人员和开发者都能够准确的通过英伟达的开放模型许可协议自由使用 Cosmos 模型,并且该许可协议允许商业用途。

  按照英伟达展示的案例,Cosmos 已经被应用于模拟真实环境,如工厂车间或驾驶场景。或者与 Sora 类似,使用多模态内容(如文本、图像、视频以及机器人传感器数据)的输入生成基于物理定律的视频。

  目前,已经有包括 Wayve、Uber 这样的无人驾驶公司,在使用 Cosmos 用于加速自动驾驶技术的推进。黄仁勋也表示希望 Cosmos「能为机器人和工业 AI 领域带来像 Llama 为企业 AI 所带来的变革。」

  除了世界模型,一同公布的还有英伟达数字孪生领域的新成果:Mega Omniverse Blueprint,一个用于创建工业数字孪生的框架。

  英伟达表示,这一全新框架通过软件定义的测试和优化,为工厂和仓库带来了工业 AI 和机器人模拟的新平台。

  据黄仁勋介绍,当前全球的 1000 万工厂、近 20 万个仓库和 4000 万英里高速公路构成了我们物理世界的「计算」网络。然而,这个庞大网络中的生产设施和配送中心网络仍然需要手动设计、操作和优化。

  在仓储和配送中,操作员面临高度复杂的决策优化问题——包括人类工人、机器人、代理系统和设备之间的变量和相互依赖性仍然复杂,,当前的数字孪生仍然很难实现在这种复杂环境下的分析与处理。

  针对这种物理世界的需求,英伟达发布了名为「Mega」的 Omniverse Blueprint 框架,用于在数字孪生环境中大规模开发、测试和优化物理 AI 和机器人队列,然后再部署到现实设施中。

  目前,先进的仓库和工厂慢慢的开始使用超过数百个自主移动机器人、机械臂和人形机器人与人类协作工作。由于越来越复杂的传感器和机器人自主系统的实现,因此就需要在模拟中进行协调训练以优化操作、确保安全并避免中断。

  针对机器人的自主系统,模拟路径规划的各种可能性,从而找出效率最高的版本|图片来自:英伟达

  针对这种需求,Mega 提供了一个参考架构,基于英伟达加速计算、AI、Nvidia Isaac 和 Nvidia Omniverse 技术,用于开发和测试数字孪生。这些数字孪生可用于测试驱动机器人的 AI 大脑、视频分析 AI 代理、设备等,从而处理庞大的复杂性和规模。

  通过这种数字孪生,公司能够一直更新其设施中的机器人大脑,以实现智能化的路径规划和任务分配,从而提升运营效率。

  在模拟环境中,这些机器人能通过感知和推理达成目标,规划下一步动作并在数字孪生中执行。这种循环会持续进行,Mega 精确跟踪数字孪生中所有资产的状态和位置。

  与 IT 行业不同,物理工业市场仍在等待自己的软件定义时刻。「未来,每个工厂都会有一个数字孪生」黄仁勋说道。

  随着大模型「炼丹」在最近几年迅速成为全民浪潮,就连普通用户中都涌现出了了不少对高算力有需求的使用场景——但显然不是任何一个人都有条件搞 GPU 集群来训练自己的大模型。

  针对这种需求与现实的落差,这次英伟达拿出了一个专属的解决方案:一台相当于 Mac mini 大小的计算单元 Project Digits。

  Project Digits的核心是新一代 GB10 Grace Blackwell 芯片,这款桌面级系统能处理高达2000 亿参数的 AI 模型,同时使用标准家用电源插座实现供电——这点在以往同等算力需要更大且耗电更多的硬件上来讲通常是很难来想象的事。

  英伟达还为 Project Digits 用户更好的提供了各种 AI 软件,包括开发工具包、编排工具,以及通过英伟达 NGC 目录提供的预训练模型。操作系统运行基于 Linux 的 英伟达 DGX OS,并支持主流框架,如 PyTorch、Python 和 Jupyter。

  开发者可通过英伟达 NeMo 框架对模型进行微调,还能够正常的使用英伟达 RAPIDS 库 加速数据科学工作流程。

  在本地开发和测试 AI 模型后,用户都能够将这些模型部署到云服务或数据中心基础设施中,保持与 Grace Blackwell 架构和 英伟达 AI 企业软件平台的无缝对接。

  不仅外观与 Mac mini 相似,Project Digits 甚至就连用法都与 Mac mini 异常接近:对需要更强大算力的应用,两台 Project Digits 系统能连接在一起,获得足以处理高达 4050 亿参数模型的性能。

  如果你对这个模型体积没有准确概念,这里有一个参照物:Meta 目前最顶级的模型 Llama 3.1 有 4050 亿参数

  换言之,有了两台这样的「Mac mini」,你就能实现在家搭建起一个能跑起来目前最顶级的大模型的「超算中心」。

  Project Digits 将于今年五月正式推出,起售价为 3000 美元。虽然这仍然不是一个便宜的价格,但仍然是英伟达为个人开发者提供的一种能够接触到超级算力的解决方案,同时也为 AI 应用的研发与部署,带来了更高的灵活性和效率。

  虽然 CES 上,消费电子才是主流,但是黄仁勋的开场,再次证明在仍在发展的 AI 浪潮中,基建的快速进化,才是重中之重。

  算力、模型、应用落地,英伟达的「AI 基建三件套」已经越来越成熟,这才是为什么老黄并没有再次说出那句经典得「买得多、省得多」——他早已不需要说了,英伟达的重心早已不是单纯的「卖卡」,他们有了更大的目标和野心。而当晚的发布会上,黄仁勋已经将公司的计划「提前剧透」了。

返回列表↑