2月16日,OpenAI在社交平台X上宣布了其全新文生视频AI模型Sora的诞生。这款模型引发了业界的广泛关注,被誉为视频生成领域的GPT-3时刻。
OpenAI Sora核心能力在于其能创建长达60秒、细节丰富的视频,其中涵盖了复杂的摄像机运动及多个充满活力与情感的角色。它不同于传统的视频编辑方式,而是通过构建一个虚拟的三维空间,再模拟镜头记录这一空间,从而生成高度逼真的视频。
360创始人周鸿祎认为,Sora的出现可能将通用人工智能的实现时间从10年缩短至1年。英伟达AI研究院的Jim Fan则从技术层面评价Sora为一个“数据驱动的物理引擎”和“世界模型”,其设计理念领先了行业一个版本。
Sora的成功得益于OpenAI在AI计算效率方面的突破。通过引入与token对应的“Patch”数据单位,OpenAI将图形语言转化为对应格式的Patch进行计算,不仅保证了模型的扩展性,还极大提升了单位算力内的运算效率。
OpenAI的每一次创新都似乎能为AI、影视、社媒等行业带来颠覆性的改变。从ChatGPT到GPT-4,再到如今的Sora,OpenAI的技术积累为其在AI领域的领先地位奠定了坚实基础。我们期待Sora能为行业带来更多的惊喜与突破。