NVIDIA推出大型语言模型，助推AI和生物技术发展

新闻中心

关注蓝耘了解更多咨询

来源: 蓝耘公众号 2022年09月23日

9 月 20 日，一年一度的GTC 主题演讲，NVIDIA创始人兼首席执行官黄仁勋发布了多项“硬核”技术，包括新一代GeForce RTX 40系列GPU，两项全新大型语言模型（LLM）云AI 服务——NVIDIA NeMo 大型语言模型服务和NVIDIA BioNeMo LLM 服务，以及用于构建和运行工业元宇宙应用的 Omniverse Cloud服务，介绍了NVIDIA　RTX、NVIDIA　AI和NVIDIA　Omniverse平台如何推动AI领域的新突破、新应用和科学及工业的AI浪潮。

黄仁勋在发布会上介绍了由第3代RTX架构Ada助力的新一代GeForce RTX 40系列GPU

黄仁勋发布全新GeForce RTX 4090的性能提升至上一代RTX 3090 Ti的4倍

全新GeForce RTX 4090的性能提升至上一代RTX 3090 Ti的4倍，将于10月12日上市，零售价¥12,999元起。

下一代GeForce RTX 40系列GPU基于台积电 4nm 工艺打造，包括RTX 4090和RTX 4080。顶配GeForce RTX 4090将以1599美元的售价于10月12日上市，具有 760 亿个晶体管、16384个 CUDA 核心和 24GB 高速镁光 GDDR6X 显存，在 4K 分辨率的游戏中持续以超过 100 FPS 运行。RTX 4080有两种版本：12GB美光GDDR6X显存和16GB美光GDDR6X显存，创作者可以根据他们的需要选择内存容量。RTX 4080将在11月上市，售价分别为899美元及1199美元。

值得注意的是，第3代RTX架构——Ada Lovelace,单个Ada GPU即可支持RacerX的运行，能够集成760亿个晶体管和超过18000个CUDA核心，比上一代Ampere多70％，90TFLOPs的全新SM多单元流处理器，性能超过上一代2倍，还包括一个具有两倍光线-三角形相交吞吐量的全新RT Core，以及一个具有Hopper FP8 Transformer Engine可提供1.4PetaFLOP张量处理性能的全新Tensor Core。Ada的SM多单元流处理器包含Shader Execution Reordering（着重器执行重排序）新技术，可实时重新调度任务，将光线追踪性能提升2-3倍，该技术的创新程度可和CPU的乱序执行（CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术）相媲美。

Ada Lovelace取名自世界上第一位计算机程序员英国数学家艾达·勒芙蕾丝伯爵夫人

除此之外，Ada还引入了NVIDIA DLSS技术的最新版本——DLSS 3（Deep Learning Super Sampling，深度学习超级采样），Ada与DLSS 3配合使得RTX 40系列较上一代性能提升最高可达4倍，正在为完全基于仿真的未来游戏铺路，其中光线追踪技术是重要看点。

DLSS 3开启前后帧率的变化

“RTX光线追踪和神经网络渲染的时代正在全面展开，全新英伟达Ada Lovelace架构将其推向了新的高度，”黄仁勋在GTC大会主题演讲上说。

GeForce RTX 40系列相较于以前产品，价格大幅提升，优化的性能将更多定位在对图形和显示领域要求高的用户中。同时，较高的价格定位也将侧面带动RTX 30 系列显卡的库存消化。

黄仁勋在演讲中发布了超大规模神经网络开发工具，全新的大型语言模型（LLM）云 AI 服务，包括旨在帮助开发者定制大规模语言模型的NVIDIA NeMo 大型语言模型服务，和帮助研究人员生成和预测分子、蛋白质及 DNA的 NVIDIA BioNeMo LLM 服务。

LLM 可部署定制的 AI 应用程序，广泛用于内容生成、文本摘要、聊天机器人、代码开发，以及蛋白质结构和生物分子特性预测等场景。

数字生物学框架NVIDIA BioNeMo 服务是云应用程序编程接口（API），可以将 LLM 用例的扩展，包括两个用于化学和生物学应用的新 BioNeMo 语言模型，为研究人员提供蛋白质、DNA 和生物化学数据方面的支持，加快制药和生物技术公司的药物研发速度。

黄仁勋在演讲中说：“大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整，可将 LLM 的力量带给数百万的开发者，让他们无需重新构建庞大的模型，即可创建各种语言服务并推动科学发现。”

在自动驾驶方面，NVIDIA发布了中央计算芯片DRIVE Thor（雷神索尔），并由于新品更为强势而放弃了去年发布的自动驾驶Altan芯片。黄仁勋称索尔是专为汽车自动驾驶而诞生的芯片。原本自动驾驶中的不同系统需要不同的控制芯片，而索尔最大的突破在于实现了中央计算芯片统一提供支持，可同时为ADSD、自动驾驶、电机、座舱等多个系统域提供算力。

NVIDIA针对一直在领先布局的元宇宙，宣布推出了首款软件加基础设施即服务产品——NVIDIA Omniverse™ Cloud，满足艺术家、开发者和企业团队可以在任何地点使用这套综合、全面的云服务来设计、发布、运行和体验元宇宙应用的需求。

目前世界各地工业元宇宙的探索应用不断发展，未来所有的产品都将具有数字孪生，制造商利用数字孪生模拟产品在物理世界中的作用和性能。云端Omniverse可以连接世界各地的团队，为工作团队提供无需本地计算能力的即时协作处理共享场景，共同设计、构建和运行虚拟世界和数字孪生，设计、制造和运营物理世界中的事物，使得物理产品能够大规模部署。

NVIDIA针对一直在领先布局的元宇宙，宣布推出了首款软件加基础设施即服务产品——NVIDIA Omniverse™ Cloud

包括RIMAC Group、WPP 和西门子在内的全球领先企业纷纷支持Omniverse Cloud，并已经开始应用。

德国铁路运营商Deutsche Bahn的数字部门Digitale Schiene Deutschland使用Omniverse Cloud，在不建造新轨道的情况下扩大网络容量，建立第一个国家级的轨道网络数字孪生模拟。

Rimac是AI赋能的超级跑车和高级电动车解决方案的技术先行者，利用Omniverse Cloud为其3D团队实现协作工作流，并为受众提供先进的3D体验。

汽车的3D模型由拥有独特技能的大型团队设计而成，每个团队都有自己的专业工具，设计师可以连接到Omniverse Nucleus Cloud共享数据库引擎，通过USD工作流，从自己惯用的工具中聚合完整的CAD保真度数据集。每位设计师使用各自的RTX计算机或从云端OVX服务器串流Omniverse应用。Rimac将真值USD模型集成到高级、实时3D配置器中并将其发布到NVIDIA图形交付网络，构建分布式数据中心的全球级网络，可将高性能低延迟的3D体验串流到边缘设备，Rimac粉丝和消费者通过物理精准的材质体验跑车3D模型。

除RTX 40系列外，NVIDIA在图形计算架构、游戏开发、AI 加速、工业元宇宙、云计算、量子计算等方面开发了一系列硬核技术，Omniverse Cloud更是渗透了万物互联、数字孪生的核心理念，全新的大型语言模型NVIDIA NeMo和NVIDIA BioNeMo，将为AI领域尤其是生科领域的研发所需的高性能计算要求赋能以新的生态，蓝耘将紧跟最新的算法步伐，推动AI领域数据处理及存储配套计算集群的算力及配套软件的服务水平迈上新阶段。

作为GPU算力云服务商，蓝耘依托自有智算云平台，为客户提供包括GPU虚拟云主机、HPC平台、裸金属GPU服务器等在内的产品/服务。随着新一代RTX 上市，蓝耘也将随之提升计算硬件水平，以赋能生物医药、自动驾驶、机器学习、计算机视觉等泛 AI 应用场景以及数字孪生等前沿科技领域，加速推进中国人工智能等科技领域创新。

在生命科学领域，蓝耘可为客户提供涵盖基因测序分析、样本筛选、蛋白质结构预测、分子动力学模拟、药物靶点发现等应用场景在内的一站式高性能计算整体解决方案，目前已为多个大型科研项目助推，并成功落地。自动驾驶也是蓝耘重点耕耘的领域，近几年，随着自动驾驶进入商业化探索，该领域对算力的需求呈指数级增长，依托蓝耘GPU智算云平台，蓝耘为自动驾驶企业提供软硬云一体化的算力解决方案，目前已与头部企业展开初步合作。