推广 热搜： page 关键词服务搜索获取链接搜索引擎哪些数据分析数据分析系统

【每周科普】以假乱真！文字直接生成视频，AI 视频工具 Sora 是怎么做到的？

日期：2024-12-26 作者：h0dsa caijiyuan 评论：0 移动：https://sicmodule.kub2b.com/mobile/news/10223.html

核心提示：2024年2月16日，Open AI在X（原 Twitter）上发布了一条消息，隆重介绍了自己的新文本转视频模型——Sora。这个模型可以生成最长6

2024年2月16日，Open AI在X（原 Twitter）上发布了一条消息，隆重介绍了自己的新文本转视频模型——Sora。

这个模型可以生成最长60秒的视频，并且在这个过程中，还能够自己切换镜头，甚至给出特写。下面这些，就是视频提示词译文及Sora直接根据提示词英文原文生成的“作品”。

一位时尚的女士走在亮着霓虹灯和广告牌的东京街头。她穿着黑色皮夹克、红色长裙和黑色靴子，手提一只黑色包包。她戴着太阳镜，涂着红色口红。她走路既自信又随意。街道潮湿，地面上的水能够像镜面一样反射色彩斑斓的灯光，路上有很多行人来来往往。

rame class="video_iframe rich_pages" data-w="1920" data-ratio="1.7777777777777777" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2F03UUuUr98GKiajZc2UgnbJiaN8u8r9pia0M3U6ucOacClUM7oI8tZK12ms75fqDm4IRWx7d3zWj8vPDh4RzQDfkxw%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3332515370380918785" data-vidtype="2" allowfullscreen="" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3332515370380918785">rame>

视频来源：Open AI官网

一段3D动画，展现一种又小又圆的毛茸茸生物在一个充满活力的、被魔法环绕的森林中探险。这种生物是兔子和松鼠的混合体，拥有柔软的蓝色皮毛和一条蓬松的带有条纹的尾巴。它沿着一条闪闪发光的小溪跳跃，眼睛充满了好奇。森林里充满了魔法元素：有发光并能变换颜色的花朵，有紫色和银色叶子的树木，以及有类似萤火虫的漂浮的光点。这个生物最终停下来与一群围绕着蘑菇跳舞的小仙子玩耍。这个生物抬头敬畏地看着一棵巨大发光树木，这棵树似乎是森林的心脏。

rame class="video_iframe rich_pages" data-w="1904" data-ratio="1.762962962962963" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2F03UUuUr98GKiajZc2UgnbJiaN8u8r9pia0Mlr9KBkA3nfusnEDe1Mmq0sc6qnPyAAVk47XUro3DYAr5ALiauURX8Qg%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3332520808363163650" data-vidtype="2" allowfullscreen="" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3332520808363163650">rame>

，时

从2022年下半年开始，Midjourney、Stable Diffusion之类的应用已经可以根据文本提示词生成对应的图片了。在2023年9月，GPT 4.0和DALLE 3结合，也让我们能够用聊天化的方式生成、修改图片。

AI生成视频也不是什么新鲜事了。在这次的Sora发布之前，也已经有一些视频生成AI，比如Pika、Stable video、RunwayML等等。但与Sora相比，其他模型生成视频的时长都比较短，而且在摄像机的运动、镜头切换等方面也要弱很多。

rame class="video_iframe rich_pages" data-w="1280" data-ratio="1.7777777777777777" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2F03UUuUr98GKiajZc2UgnbJiaN8u8r9pia0M0AEfbiaqH4MaiaMewT2SCxATBO95UtxSIN7Rb5GFumicognk3dL9Re30g%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3332529788032483329" data-vidtype="2" allowfullscreen="" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3332529788032483329">rame>

视频取自：OpenAI官网

“强大的Sora”仍有一些缺陷

虽然Sora展现出了强大的能力，但现阶段它还不够完美。

并不是每一次Sora都能生成出令人满意的视频。《麻省理工科技评论（MIT Technology Review）》主笔Will Douglas Heaven写道：“Sora发布出来的视频已经是从大量的成果中挑选出的佼佼者了。”但即便是这些“经过挑选的佼佼者”也不完美。

在Sora的技术报告中也承认，现阶段Sora生成的视频存在一些缺陷。比如，下面这个“考古工作者们挖掘出一个塑料椅”的视频片段里，这个塑料椅显然有点不遵守客观的物理规律。

rame class="video_iframe rich_pages" data-w="1280" data-ratio="1.7777777777777777" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2F03UUuUr98GKiajZc2UgnbJiaN8u8r9pia0M3WVtTfnrJcp4MKmKE1HX1QdTqdWtpjaojVQ9e5JnicfJDaibnwatf6DA%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3332525803225579524" data-vidtype="2" allowfullscreen="" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3332525803225579524">rame>

另外，下面这个玻璃杯破碎的过程也不那么“科学”——在杯子破裂之前，杯子里的液体就已经流出来了。

rame class="video_iframe rich_pages" data-w="1280" data-ratio="1.7777777777777777" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2F03UUuUr98GKiajZc2UgnbJiaN8u8r9pia0MHYO4XtUu592fFicK5S3K7AVTxWEvLcoT1ZNJnhB9BTYEJq2gcbgyMpA%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3332528765947707392" data-vidtype="2" allowfullscreen="" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3332528765947707392">rame>

所以，Sora还有很多需要完善的地方。但毫无疑问，目前Sora展现出来的能力已经说明了，这是一条非常有前景的道路。

Sora安全吗？

会取代人类吗？

这几天，Sora生成的视频刷爆了许多人的朋友圈，人们除了感叹Sora的厉害，同样也展现出了担忧，这些担忧集中在两个方面。

第一个担忧是：Sora生成视频的能力实在是太厉害了，如果这样的技术被用来造假，岂不是太可怕了？未来我们怎么知道看到的视频是真的还是假的？

而另一个担忧主要来自视频行业的从业者，如果Sora这样的模型普及开来，视频行业从业者是不是都要丢了饭碗？

先说说安全问题。其实，Open AI也考虑到了Sora可能带来的安全问题。目前，Sora仅对少数人开放，在确保它不会被用来做坏事之前，Sora是不会向大众开放的。

那Sora是否会代替人类视频工作者？

可以肯定的是，Sora的出现可能会威胁一些动画素材的制作者。

比如，今年1月，《好莱坞报道》进行了一项针对300名娱乐行业领导者的调查，有四分之三的受访者表示AI会减少未来的工作岗位，未来3年内大约会有20多万个职位受到影响。而Sora优异的表现会加重这一影响。

但换一个角度想，每一次新兴技术的出现在带来威胁的同时也会带来新的机会。

包括Sora在内的视频生成AI只是一个工具，视频的创意来源还是需要人类提供。Sora或许能够帮助人类更高效地生产视频，同时，也让每一个普通人都有机会制作自己的创意视频。

参考文献

[1]https://openai.com/research/video-generation-models-as-world-simulators

[2]https://openai.com/Sora
[3]https://scholar.harvard.edu/binxuw/classes/machine-learning-scratch/materials/foundation-diffusion-generative-models

[4]https://www.hollywoodreporter.com/business/business-news/ai-hollywood-workers-job-cuts-1235811009/

策划制作

本文为科普中国-星空计划作品

出品｜中国科协科普部

监制｜中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

作者丨小玮科普创作者

审核丨秦曾昌北京航空航天大学自动化科学与电气工程学院副教授

策划丨徐来

责编丨何通

作者

推荐阅读

●普洱市科协节前送温暖建设有温度的科技工作者之家

●普洱市两家科协、1名科普中国信息员获中国科协表扬

●凝心聚力谋发展真抓实干开新局——2024年普洱市科协工作暨业务培训会召开

免责声明

欢迎投稿

投稿内容：普洱市内外科技类新闻、科普知识、科普图片等与科技有关的各类知识、趣闻，但要求原创。
投稿邮箱：pekxbgs@163.com

本文地址：https://sicmodule.kub2b.com/news/10223.html 企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

先一步开启“年味”：鲸灵羽绒季&年货节刷新品牌战绩

最新动态

推荐图文

最新资讯

点击排行

• 云手机基本原理与构建（云手机源码怎样炼成的？	• 苹果手机怎么用苹果手机「苹果手机怎么用」
• 决色中轴双奢系列保护壳，给vivo X Fold3 Pro披	• steam手机版怎么扫描二维码steam手机版下载「st
• 如何选择适合自己的手机：全面分析与前沿技巧手	• steamoksteam手机版下载「steamok」
• 侧躺玩手机会瞎？玩手机的正确姿势，速看！看手	• 红米手机usb驱动（红米手机usb驱动下载）
• 苹果手机语音备忘录（苹果语音备忘录彻底删除怎	• 魅果手机怎么样（魅果手机怎么样骁龙处理器）