首页 >> 产业 >> 产业 >> 正文
Sora将如何影响第四次工业革命
  • 工业4俱乐部
  • 2024年3月7日 07:59

2024年春节以来,Sora出世,社会表现千姿百态:卖课割韭菜,种草造恐慌,幻想赠流量;五味杂陈:惊喜、恐慌、好奇、探秘。工业4.0俱乐部的很多成员都在询问关于Sora的有关问题,希望得到一些比较精准的答案。胡院长,你作为国内工业4.0的研究专家,又对数字孪生体有很深的研究,我今天代表俱乐部的会员向你请教几个问题。

问题一、

杜玉河:Sora到底是一个什么技术?如何理解OpenAI官方的表述?

胡权院长:

Sora是一种AI模型,它提供从文本生成视频的功能。OpenAI 官方介绍称,Sora可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示,这很好说明其价值在于视频生成。

问题二、

杜玉河:Sora主要用于做什么?是一种能改变世界的技术路径吗?

胡权院长:

从OpenAI的介绍来看,Sora当前具备的功能是通过文本提示生成视频,即text-to-video,因此对标的是Pika、RunwayML和Stable Video等产品,这是需要读者注意的。这种技术对视频相关的行业影响非常大,例如,影视、广告、训练和教育等,在一定程度上,它是改变这些领域的一种技术。

问题三、

杜玉河:对 OpenAI的官网上讲Sora是一种世界模拟器,Sora是否是模拟世界的最佳工具?

胡权院长:

人们有模拟物理世界的物体、人或系统的需要,通常有有三种技术路径:一是通过照相机或录像设备对现实世界的场景记录,这种方式大家都比较熟悉,优点和不足是明显的;二是利用CAD或CAE等设计软件来重现或创造一种数字场景;三是利用生成式工具,呈现现实世界已有或没有的某种场景。

Sora属于以上提及的第三种技术,它有自己的优势和短处,优势就是生成速度快,“涌现”特征明显,但对于是否跟现实世界的场景一致,甚至是否满足物理世界的规律不属于考虑范畴,更别说现实世界是否有这些物体或行动。

因此,Sora对于创意行业呈现某种场景是有价值,但对于人们通常称的“模拟”已有或可以建造的物理世界之目的,不是Sora提供的功能。

问题四、

杜玉河:近年来,大家一直在谈通用人工智能技术,根据你的经验来判断人类距离AGI还有多远?

胡权院长:

按照百度百科提供的定义,通用人工智能(AGI)是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。

在算力、算法和应用等多方进展的促进下,人工智能的发展非常迅速,特别是最近几年,文本、图像、音频和视频等的生成式AI应用效果进展很大,在传统的图灵判断上有了巨大突破,人们在体验上也感觉AI跟通用人工智能的距离越来越近。

随着多模态AI的应用,叠加数字孪生体、数据科学等的进展,通用人工智能会越来越近。工业4.0研究院的预测认为,按照第四次工业革命通常50年周期的规律,具有实用价值的AGI在2050年可能达到一个较成熟阶段。

问题五.

杜玉河:Sora将对现行的社会产生哪些影响?

胡权院长:

作为文生视频的领先工具,Sora的进一步商业化和产业化,将推动AI进入影视创意行业,这可能是它对现行社会的最大影响。另外,Sora的出现,会对造假或欺骗等带来一次升级,骗子更容易制作以假乱真的信息,这给人们的防御方式带来了挑战。

问题六、

杜玉河:Sora与新质生产力有什么关系?将如何推动新型工业化?是否能推动数据要素化?将带动哪些产业的发展?

胡权院长:

新质生产力指的是给工作、生活与娱乐等带来新的价值,Sora文生视频的能力非常强大,能大幅提升影视娱乐行业的效率,促进更丰富多彩的产品及服务产生。

对于工业领域的应用来讲,Sora本身提供的服务恐怕关联不大,但该应用背后代表的生成式AI技术,以及多模态AI应用,将大大改善传统的装备设计、制造、使用及维护,从而丰富新型工业化的内涵。

关于数据要素化的促进,Sora所代表的生成式视频工具,它对数据的依赖更突出。简单的讲,拥有大量视频的平台或企业,可以把这些资源作为数据出售给类似Sora生成式视频工具或应用的公司,帮助其更具有创意能力。

简而言之,Sora的出现,将率先对算力、(视频)数据、影视、广告以及创意等公司产生影响,随后会进一步扩展到人们生活或相关领域,甚至产生一些新的行业或生意。

问题七、

杜玉河:Sora与工业4.0有没有关系?有什么样的关系?与工业数字孪生体,工业元宇宙有什么关系?

胡权院长:

按照工业4.0研究院的描述,“工业4.0”是数字孪生体、人工智能和数据科学等新一代数字技术驱动下的第四次工业革命,Sora是生成式人工智能技术的一种突破和应用。

从基础技术来看,Sora采用的技术涉及Transformer、扩散模型等;在具体应用上,它利用基于Transformer的扩散模型,对大量视频数据进行学习,从而具备根据文字提示生成视频场景的能力。

工业数字孪生体很明确需要物理世界的参与,Sora基本上不跟物理世界进行交互,因此,Sora应用跟工业数字孪生体不同,但其基础技术可以引入到工业数字孪生体,从而改善其同步物理世界的能力。

工业元宇宙是工业数字孪生体的一个子集,它的核心价值在于呈现一个物理世界已有或可以建造的数字场景,那么引入Sora这种视频工具带来的场景涌现性,通过施加物理规律的约束,能够让工业元宇宙在数字空间的互动更具有创造性。

问题八、

杜玉河:Sora的出现无论是国内,国外影响力都非常大,我在想问一个问题就是中国版的Sora何时能出现?需要哪些条件?采取哪些措施?

胡权院长:

随着我国进一步重视生成式AI,以及Google、Meta等公司开源项目的公布,我国人工智能企业很快会推出类似的产品,估计在今年下半年就有声称中国版的Sora出现。

不过,如果要持续推动我国人工智能产业的创新发展,争取在下一个大应用上领先,就应该加强人工智能技术生态的建设,例如,学术研究、人才培养、AI芯片、创业资本以及宽松的政策等,这些都是必不可少的条件。

对于工业4.0研究院来讲,我们当前聚焦“工业多模态AI”的研究和开发,并跟数字孪生体联盟的成员深入互动,争取为我国新一代人工智能发展做出应有的贡献。

感谢胡院长细致讲解。我们相信这是第四次工业革命的新技术的开始。相信还会有更多颠覆性的技术出现。我在此代表俱乐部的所有会员对胡院长表示感谢。


编 辑:甄清岚
分享到: