Sora一石千层浪：视频生成新模型暗藏风险

坐落于旧金山的美国人工智能公司 OpenAI 近日推出了一款创新的生成式人工智能模型 Sora。这款模型能够根据文本指令生成视频，这进一步巩固了 OpenAI 在人工智能领域翘首的地位，并引发科技界的热议。它也加剧了人们对“深度伪造”等风险的担忧。

Sora 是 OpenAI 首次涉足人工智能视频生成的领域。据悉，该模型采用 Transformer 架构，根据文本指令，它可以创建接近真实且充满想象力的场景，生成各种风格、不同画面比例的高清视频，最长可达一分钟。它甚至可以根据静态图像生成视频，或是扩展现有视频或补全缺失的帧。

分析人士认为，Sora 再次凸显了人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大前景，既为塑造影视产业的新业态打开大门，也可能颠覆现有的影视产业。去年，好莱坞经历了 63 年来的首次编剧和演员全行业罢工，因为人工智能有可能取代部分行业工作。Sora 的横空出世让这一威胁变得更加紧迫和真实。在 Sora 发布后的第二天，以图像处理和视频制作软件为主营业务的奥多比公司 (Adobe) 股价应声下跌超过 7%。

虽然 OpenAI 不是第一家涉足文本转视频领域的公司，但 Sora 的推出使 OpenAI 在这一赛道占据领先地位，巩固了其在生成式人工智能领域的领军地位。高德纳咨询公司分析师钱德拉塞卡兰表示：“在这个领域，没有任何一家公司比 OpenAI 野心更大，而且这种野心似乎还在不断增长。”

OpenAI 表示，Sora 对语言有着深入的理解，不仅可以理解用户的文本提示，还可以理解所述事物在物理世界中的存在方式。公司称，“我们正在教人工智能理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要与现实世界交互的问题。”

Sora一石千层浪：视频生成新模型暗藏风险