社区首页 / 我心飞扬 / 帖子详情

Sora:OpenAI引领AI新纪元

发表于:2024-02-18 19:04 [ 只看楼主] 14952 0 0

自ChatGPT在2023年春节引领AI风潮后,OpenAI再次于2024年春节前夕投下重磅“深水炸弹”——发布文生视频模型Sora。其瞬间引爆了AI圈,被誉为“颠覆性”的技术革命。

Sora两大显著特点——视频时长与逼真程度,同时解决了AI领域的两大难题。360创始人周鸿祎甚至大胆预测,Sora的发布意味着通用人工智能(AGI)的实现时间可能从十年大幅缩短至一年。

技术惊艳亮相

OpenAI此次发布的Sora模型,无需任何预兆或提前透露,便以其高度逼真的视频生成能力震撼市场。简短的文本指令,便可轻松输出长达60秒的视频,细致的背景、多角度镜头以及充满情感的角色,一切都仿佛触手可及。

Sora采用Transformer架构,展现出强大的扩展性。同时,基于DALL·E和GPT的研究基础,结合DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,实现了惊人的技术进步。

333.png专家解析亮点

北京市社会科学院副研究员王鹏解析了Sora的三大亮点:首先是60秒长视频的流畅性与稳定性;其次是单视频内实现多角度镜头切换,逻辑清晰且流畅;最后是Sora对真实世界细节的精准捕捉,如光影反射、运动方式等,极大提升了视频的真实感。

尽管Sora表现出色,但仍存在短板。OpenAI坦承,Sora目前尚无法准确模拟复杂场景的物理原理及因果关系,这在视频中可能表现为一些不自然的细节,如咬了一口饼干却未留下咬痕。

AGI的新篇章

新壹科技CTO张华伟认为,Sora的发布标志着通过文字描述生成连续视觉内容的时代已经来临。这将极大地提高视频内容的生产效率。

随着Sora等文生视频技术的成熟,影视、游戏、广告等多个行业将迎来颠覆性的变革。中国企业资本联盟副理事长柏文喜指出,Sora有望帮助各行业提升视频内容创作效率,降低制作成本。

不过,中国信息协会常务理事朱克力提醒,虽然Sora在技术上取得了突破,但在实际应用中仍需解决稳定性、可扩展性和计算效率等问题。此外,各行业对新技术的接受和应用也需要时间。

AGI的星辰大海

Sora真正的潜力可能远超视频范畴。周鸿祎认为,AGI的实现将因Sora的发布而大大加速。

天使投资人、资深人工智能专家郭涛强调,视频包含了丰富的时空信息,Sora在这方面的突破对于推动AGI的发展具有关键作用。

朱克力也指出,文生视频技术成功解决了在连续时间序列中保持场景一致性、物体动态关系和光影变化的难题,这对于AGI的发展具有显著推动作用。


  • 点赞  0
  • 收藏
  • 扫一扫分享朋友圈

    二维码

  • 分享

全部回复 (0) 倒向排序