Sora一石千层浪:视频生成新模型暗藏风险

小王

坐落于旧金山的美国人工智能公司 OpenAI 近日推出了一款创新的生成式人工智能模型 Sora。这款模型能够根据文本指令生成视频,这进一步巩固了 OpenAI 在人工智能领域翘首的地位,并引发科技界的热议。它也加剧了人们对“深度伪造”等风险的担忧。

Sora 是 OpenAI 首次涉足人工智能视频生成的领域。据悉,该模型采用 Transformer 架构,根据文本指令,它可以创建接近真实且充满想象力的场景,生成各种风格、不同画面比例的高清视频,最长可达一分钟。它甚至可以根据静态图像生成视频,或是扩展现有视频或补全缺失的帧。

分析人士认为,Sora 再次凸显了人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大前景,既为塑造影视产业的新业态打开大门,也可能颠覆现有的影视产业。去年,好莱坞经历了 63 年来的首次编剧和演员全行业罢工,因为人工智能有可能取代部分行业工作。Sora 的横空出世让这一威胁变得更加紧迫和真实。在 Sora 发布后的第二天,以图像处理和视频制作软件为主营业务的奥多比公司 (Adobe) 股价应声下跌超过 7%。

虽然 OpenAI 不是第一家涉足文本转视频领域的公司,但 Sora 的推出使 OpenAI 在这一赛道占据领先地位,巩固了其在生成式人工智能领域的领军地位。高德纳咨询公司分析师钱德拉塞卡兰表示:“在这个领域,没有任何一家公司比 OpenAI 野心更大,而且这种野心似乎还在不断增长。”

OpenAI 表示,Sora 对语言有着深入的理解,不仅可以理解用户的文本提示,还可以理解所述事物在物理世界中的存在方式。公司称,“我们正在教人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”

Sora一石千层浪:视频生成新模型暗藏风险

Sora 的发布可谓一石激起千层浪,但此次推出的更像是预览版,公众尚难以深入全面了解该模型的优缺点。OpenAI 表示,目前仅主要向设计师和电影制作人等特定人群提供 Sora 的访问权限,以获取有关改进该模型的反馈。公司不仅未公布训练 Sora 模型的数据等基础细节,更没有确定向公众发布的日期。

OpenAI 承认,目前 Sora 生成的视频中可能包含不合逻辑的图像,混淆左右等空间细节,难以准确模拟复杂场景的物理原理和因果关系实例,例如,一个人咬了一口饼干,饼干上却没有咬痕。随着算力增强、模型改进,人们可能会在短期内获得更加完善、先进的视频生成功能。

许多业内人士担心,Sora 将为“深度伪造”技术推波助澜。加州大学伯克利分校信息学院副院长法里德表示:“当新闻、图像、音频、视频——所有事情都可以伪造时,在这个世界里,就没有什么是真实的。”

针对造假顾虑,OpenAI 称在真正面向公众推出产品时,将确保生成视频包含来源元数据,并推出检测视频真伪的工具。

文章版权声明:除非注明,否则均为品牌家电排名网原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
验证码
评论列表 (暂无评论,2446人围观)

还没有评论,来说两句吧...

取消
微信二维码
微信二维码
支付宝二维码