AI与物理世界的“理解”:Sora视频生成的争议与挑战

《AI与物理世界的“理解”:Sora视频生成的争议与挑战》
在这个日新月异的时代,新鲜事物总是令人兴奋 。当Sora——一款能够绕过传统拍摄流程、凭空“制造”物理世界的视频AI横空出世时,人们的反应各异 。有些人看到了其颠覆性的潜力,担忧失业潮的到来;有些人则害怕意识的置换和现实的模糊化;而另一些人则认为这些担忧都是杞人忧天 。当然,还有人在其中发现了商机,赚得盆满钵满 。那么,你属于哪一类人呢?
AI是否比人类更“懂”物理世界?对于大多数人来说,仅凭文本就能生成具有强烈视觉冲击力和丰富色彩层次的视频,似乎证明了AI已经开始以自己的方式理解我们所处的物理世界 。尽管现在的AI还“看不见”世界 , 但通过人类构建的模型和持续的信息输入,它已经形成了自己独特的世界观 。然而,这只是外行人的看法,内行人可能会有不同的见解 。
从视频生成的角度来看,AI的出现可能会对视频创作行业带来失业风险 。已经有声音预言,不久的将来将会迎来一波失业潮 。然而,业内人士并不这么认为 。他们认为,尽管Sora可以轻松生成视频,但其底层思维并非真正理解了物理规律,而是基于“语言模型”的运行机制 。换句话说,AI并没有直接看到真实的世界,它所理解的世界仅仅是基于人类提供的文本信息 。这些信息经过人类的加工和提炼,AI只是借助这些文字描述间接地看待世界 。因此,AI与真实世界之间还存在一层难以逾越的隔阂 。
杨立昆是该领域的专家之一,曾获得图灵奖,并在Facebook从事人工智能研究 。他直言不讳地表示,Sora所“理解”的物理世界与人类所知的物理世界截然不同 。因此 , 将Sora称为世界模拟器还为时过早 。值得注意的是,杨立昆所在的公司与OpenAI存在竞争关系 , 因此他的观点可能带有一定的主观色彩 。尽管如此 , 其他一些业内人士也表达了类似的看法 。
当前的AI并未直接观察世界或从物理世界获取第一手信息,而是通过大量数据进行学习和理解 。因此 , 仅从数据层面去理解世界,AI的理解仍然相对浅薄 。例如 , 即使你用文字告诉AI太阳每天东升西落 , 它也不太可能理解地球绕太阳旋转的事实 。一位在谷歌工作的人工智能专家分析指出,Sora生成视频的方式主要依赖于数据插值和潜空间拼贴技术,距离真实模拟物理世界还有很长的路要走 。
有人质疑Sora的能力,认为研发人员夸大了其理解力 。但也有人认为 , 即使未来的生成式AI变得更加智能 , 也无法完全替代人类 。工具会取代人类吗?如果你将AI视为一个不断进化的智能体 , 自然会对未来可能发生的替代感到担忧 。然而 , 这种担忧在目前看来似乎过于遥远 。毕竟 , 人类赋予AI的身份仍然是工具 。就像数百万年前人类祖先学会使用石头一样,石头作为一种工具成为原始人双手的延伸 。如今,Sora学会了视频生成,这在很大程度上代替了人类的部分工作,导致那些原本从事此类工作的人面临失业的风险 。但在业内人士看来 , 这种担忧是多余的 。短期内,所有类似Sora的生成式AI产品都无法在生成和创造方面“独当一面” 。简而言之,它们目前的能力还不足以胜任实际工作 。
OpenAI发布的几个视频中出现了违反物理定律的场景,如椅子飘起来或一个人倒着跑等,这些都反映出该产品在理解力上的不足 。同样的问题也出现在之前的文本生成产品中,用户在使用一段时间后会发现,它提供的信息往往似是而非,甚至包含错误 。这种现象表明,当前的AI还无法像人类那样去理解世界 。在很多情况下,AI只能看到字面意思,而无法理解背后的深层含义 。因此,即使AI能够熟练地生成视频或其他图像内容,也很难想象会有公司愿意将所有相关工作都交给它来完成 。
【AI与物理世界的“理解”:Sora视频生成的争议与挑战】然而 , 从长远来看,随着技术的不断进步和研发的深入进行,现有的一些缺陷有望得到弥补 。如果AI对世界理解力进一步增强且无明显瑕疵,那么它是否能够胜任人类当前的一些工作呢?在某些领域确实如此,正如过去的缝纫机和现代灶台的出现改变了传统的手工缝制和风箱制造行业一样 。然而,至少在目前阶段,我们仍需谨慎对待AI的能力和局限性,避免过度依赖或夸大其作用 。

猜你喜欢