新闻中心

关注蓝耘了解更多咨询

Sora“涌现”:算力应用再加速
来源: 蓝耘公众号 2024年03月05日

龙年春节甫过,文生视频大模型Sora便以黑马之姿点燃了AI新纪年的“第一把火”。


震撼全球的“60秒”


作为OpenAI继文本生成模型“GPT”、图像生成模型“DALL·E”之后推出的又一重磅产品,Sora的热度持续发酵,正从科技圈蔓延至各行业领域,“里程碑”、“世界的模拟器”、“王炸”、“颠覆性突破”……亦成为业内热议的关键词。OpenAI表示,Sora将推动AGI(通用人工智能)的加速发展,360集团创始人、董事长兼CEO周鸿祎据此预言“AGI的实现可能从十年缩短至一两年”;特斯拉CEO马斯克忍不住发帖惊叹:“gg humans”(人类愿赌服输);身为竞争对手的AI文生视频创企Runway联合创始人兼CEO Cristóbal Valenzuela也发出“game on(比赛开始了)”的感慨。“Sora旋风”也在网络上迅速掀起一阵AI培训热潮,与之相关的付费课程也在小程序等不同渠道陆续上架。


“一个时髦的女人走在东京的街道上,街道上充满了温暖发光的霓虹灯和生动的城市标志。她穿着一件黑色的皮夹克,一件红色的长裙,还带着一个黑色的钱包……” 用户只需给出类似这样的简单文本指令(prompt),Sora就可以直接输出长达60秒的视频,画面逼真生动,情节叙事合理,还能呈现复杂的多角度镜头和多个独具创意的角色形象。


除了文生视频外,Sora还兼具图生视频、扩展生成视频、视频生成视频、连接视频等多重功能。尽管在模拟复杂物理场景和处理因果关系、空间细节等方面尚有很大提升空间,Sora在文生视频技术领域的创新突破仍有望进一步驱动“万物皆可生成”的内容生产范式变革。



被重新定义的大模型能力边界


再现AI视频生成赛道的“ChatGPT时刻”,Sora是如何做到的?据OpenAI发布的信息介绍,Sora实现了对物理世界极强的模拟能力,它不仅能够理解文本描述中的概念,还能深层次领悟并模拟“这些事物在物理世界中是如何存在的”,正如其对Sora的定位——“物理世界的模拟器”,而这一模拟能力也将是通往AGI的重要里程碑。


从DALL·E 3、Midjourney、Runway、Pika 到 “新晋顶流”Sora,以图片、视频为代表的多模态让AI更加直观和生动。而Sora加速多模态能力“涌现”的背后,隐藏着的是基于Transformer架构的强大的扩散模型(Diffusion model)技术。OpenAI表示,“扩展视频生成模型是构建物理世界通用模拟器的一条可行之路。”

区别于Pika、Runway模型传统的U-Net架构,Sora采用Transformer架构来实现文本与视频对应关系的学习以及对时间序列的理解,且随着训练计算量的不断增加,视频质量显著提升。


“算力+数据”双核驱动,AI视频生成开启“竞速跑”


生成式AI浪潮催生下的高频计算需求,被Sora的“炸裂出道”进一步引燃。Sora“源数据-Transformer-Diffusion-涌现”的技术路径下,算法的不断进化及远高于语言模型的视频训练数据量,对算力资源和计算基础设施也提出了更高的要求和挑战。


据中信证券估算,一个60帧的视频(约6—8秒)需要约6万个Patches,如果去噪步数是20的话,相当于要生成120万个Tokens,“这是相当大的计算量”。同时考虑到扩散模型在实际使用时往往需要多次生成的特性,实际计算量会远超120万个Tokens。假设Sora模型参数为30亿(据纽约大学助理教授谢赛宁推测),可以推演出Sora训练单次算力需求可能达到8.4×10^23 FLOPS(浮点运算次数),对应约1846万个A100需求,这相当于GPT-3 175B模型的2.7倍。


AI“千亿参数时代”下,创新算法、模型迭代下的训练和推理计算量以超摩尔定律的速度急剧攀升,而具备海量数据并行计算能力、擅长加速计算处理的GPU算力作为AI高效训练和推理的核心驱动力,为机器学习、深度学习和大规模数据处理、分析等任务提供澎湃的加速动能,已成为领跑AI竞速时代的“超车点”。


作为专业的GPU算力云服务提供商,蓝耘针对AIGC视频生成、大语言模型、多模态模型的开发、测试和部署,可为用户提供从GPU池化资源、高性能网络、高性能存储等基础设施到资源调度、开发环境、运行监控、运维服务等一系列AI Infra全栈服务,为用户构建从算力到应用的高速“通道”。


蓝耘自2019年起积极布局算力云服务,着手GPU算力资源池构建,至今已形成以GPU算力解决方案为基础、GPU算力云服务为核心的业务布局,致力于为AI训练、推理、视觉特效和渲染及教科研等计算密集型场景用户,提供随时随地可获取的便捷高效的GPU算力云服务,满足客户业务应用和GPU算力随需扩展的双重需求。


从理解人类思维到模拟物理世界,面对AIGC创新应用加速涌现的未来趋势,蓝耘将继续秉承“链接产业上下游、释放算力价值”的企业使命,基于灵活的基础设施、丰富的GPU算力资源和技术运营经验优势,依托智算中心“算力基座”,厚植AI探索未来的智算“土壤”,携手行业共同见证AI蓬勃创新力量。


素材来源 | OpenAI官网、Runway官网、中信证券研究所

加入元生代云,一起创造“耘”上未来
  • 全天候高效服务
    7X24小时专业服务
  • 客户价值优先
    从服务价值到创造客户价值
  • 1V1大客户服务
    定制服务方案全周期陪伴
  • 全方位安全保障
    智能监测风险预警
关于我们
产品
解决方案
服务与支持
联系我们
市场合作:Info@lanyun.net
咨询热线:400-606-3000