OpenAI展示新AI工具Sora,只需要给出简单文本提示,Sora就可以制作60秒视频。Sora是根据图像成生DALL-E工具开发的,它能自动解读提示信息,将信息扩充为一系列指令,然后用AI模型制作新视频。
之前市场上也曾出现过视频、音频制作工具,比如谷歌正在测试的Lumiere、Meta开发的Emu、AI创业公司Runway开发的工具,Sora更加强大,它制作的视频质量更高。
专业人士原本认为,像Sora这样的工具还要等2-3年才出现,它可以制作持续、有条理的视频,相比之前出现的“文本-视频”工具,Sora有很大跃升。
巴基斯坦前总理ImranKhan已经被捕入狱,他用AI制作一段视频,向拥护者演讲。围绕边境问题对抗美国联邦政府的佛罗里达州长RonDeSantis用AI音频生成器模拟前总统川普讲话。
我们今天关注的问题是:Sora能否给无人驾驶开发带来新思路?
无人驾驶领域的新希望
遥想2015年,谷歌无人驾驶项目主管ChrisUrmson曾信誓旦旦,他的目标是开发出真正的无人驾驶汽车,让他11岁的儿子不再需要考驾照。按照ChrisUrmson的说法,谷歌的目标是在2020年左右实现真正的无人驾驶。可惜,现在已经2024年,谷歌的完美无人驾驶在哪里?还没有踪影。
2015年,百度高管王劲曾表示,2020年将向中国客户销售无人驾驶汽车。很遗憾,百度也没有兑现承诺。
曾经的乐观变成悲观,无人驾驶遥遥无期,Waymo沉默寡言,特斯拉无所表现,倒是华为无人驾驶让人眼前一亮,但离改变世界也很遥远。
就在几天前,无人驾驶旗手Waymo首次宣布召回汽车,因为它开发的无人驾驶汽车在美国凤凰城发生两起车祸,与小货车相撞,原因是软件存在漏洞。
为什么无人驾驶遇挫?核心原因就是AI技术仍然不够成熟!如何突破?现在大家不再寄望于谷歌、苹果,反而将目光转向OpenAI、转向Sora。
业界普遍认为,Sora具有里程碑意义,它可以深度理解文本提示信息,可以精准生成场景,可以捕捉情绪,可以生成极具视觉冲击力的内容;Sora还可以生成多种多样的场景,比如野生动物、风景、动画,未来它在娱乐、教育、无人驾驶等领域将拥有用武之地。
Sora既能生成短视频,也能够学习现实世界物理规律并进行拓展;它可以预测场景中物体的运动、判断其轨迹,这些能力都是无人驾驶AI需要的。
周鸿祎称:“Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大影响。”人驾驶汽车的更多判断是基于对世界的理解给出的,Sora对世界的理解更上一层楼,对无人驾驶有启迪意义。
只有AGI才能拯救无人驾驶
从第一天开始,无人驾驶就面临一个问题:交道场景无数,边缘场景无数,汽车如何及时响应,避开风险?即使是高智商人类,面对复杂交通环境也会错,何况计算机?现有的AI可能无法实现真正的无人驾驶,只有AGI才可以。
Sora打开了通往AGI的大门。周鸿祎认为,Sora的诞生意味着AGI(通用人工智能)的实现可能从10年缩短至一两年。不只周鸿祎认为AGI即将到来,OpenAI创始人SamAltman也曾在多个场合表示,相当于人类等级的AI正在到来。
SamAltman所说的“人类等级AI”就是“AGI”,SamAltman坚信AGI很快就会出现。不过SamAltman也曾明确指出,他所说的AGI并不是人类所期待的那种AGI,它最多只是一种工具,目前AI还没有大规模占据各种工作职位,也没有引起经济恐慌,它充其量只是出色的生产力辅助工具。
不知道周鸿祎所说的AGI到底是何种等级的智能?
周鸿祎感慨:“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。”
Meta首席AI科学家YannLeCun远没有周鸿祎和SamAltman那么乐观,他说:“我们今天看到的系统存在诸多漏洞,它们还无法真正理解世界,系统也还没有达到真正的推理水平。如果没有训练过,现在的AI还无法规划任何事情。这些AI的确有用,但并没有走上通往人类智力的道路。”
在YannLeCun看来,现有AI与人类智力仍然有着明显差别,叫它们AGI有点过誉。人类可以理解现实世界,可以为了达成目标规划一连串动作,人类推理能力更强。
YannLeCun称:“人类婴儿降生前几个月就能学习世界运转方式,如何让AI也能拥有这种能力?我们现在还不知道。一旦人类技术只需要看几眼世界就能学习‘世界模型’,将它与规划技术结合,甚至与短期存储系统结合,我们就可能找到一条路,让AI拥有一定智能,但这种智能只是相当于‘猫’级别的智能。要让AI达到人类智能水平,还需要跨越几道智力门槛。总之,AI离人类智能还很远。”
现在的无人驾驶AI学习速度仍然不够快,智力水平不及人类,如果AGI真的实现,无人驾驶将会实现飞跃。
百姓评车
Sora将AI智能提升一个等级,虽然离AGI还有多远尚难看清,但人类迈向AGI是必然的选择,也是科技的正道。目前的AI仍然不及婴儿,无法成为无人驾驶大脑,但AGI可以。很多人会被OpenAI遮住眼睛,从而忽视一个事实:不论是微软、Meta,还是OpenAI,它们实际上追求的都是AGI。乐观者认为AGI近在眼前,悲观者认为还要50-100年才能实现,甚至有些极度悲观者认为永不可能实现。
Sora是AI的突破,更是AGI的突破,它给了悲观者更多希望。