欢迎阅读“ AI 视频”系列
《可灵( líng) vs 即梦,决战 AI 短剧》
《即梦 VS 可灵( líng),下一步战火烧向何方?》
AI 视( shì)频的战争,才刚刚开始。
在( zài)生成式 AI 的大航海时代,文( wén)字、图像、代码的疆界已相( xiāng)继被重绘,唯独“视频”这一( yī)最复杂、最昂贵、最具传播( bō)势能的内容形态,始终处( chù)在被技术反复叩门却未( wèi)彻底攻陷的高地。
这个局( jú)面,似乎终于要被 OpenAI 在 10 月 1 日( rì)推出的 Sora2 而改变。

图源:网络( luò)
如果说今年早些时候的( de) Sora 只是一次“从文本到视频( pín)”的早期演示,那么 Sora2 则更像( xiàng)是一次内容范式的重塑( sù):它不仅能生成物理一致( zhì)性更强、镜头语言更成熟( shú)的动态画面,还在音画同( tóng)步、环境声效、人物对白等( děng)方面实现了重大突破—— AI 不( bù)再只是“画面导演”,而是第( dì)一次同时担任了摄影师( shī)、编剧、配乐师和演员。
与此( cǐ)同时,OpenAI 还选择将它打包成( chéng)一个社交平台级产品—— Sora App,而( ér)不只是模型本身:创作者( zhě)可以一键生成视频、上传( chuán)人像 cameo、Remix 他人作品,甚至像刷( shuā) TikTok 一样在流里发现 AI 内容。

Sora App
这( zhè)也是为何,长期对视频生( shēng)成持谨慎态度的知名分( fēn)析师 Ben Thompson 态度大变,称之为“一( yī)个可能撼动 Meta 和 Tiktok 社交帝国( guó)根基的威胁”—— Sora 不再是技术( shù)的展示,而是内容分发逻( luó)辑的重塑。
当 AI 不仅能生成( chéng)视频,还能决定“视频如何( hé)被观看”“创作者如何被推( tuī)荐”时,整个内容平台的生( shēng)态规则都可能被重写。
面( miàn)对这股浪潮,中国的科技( jì)巨头们自然不会坐视不( bù)理。字节跳动的即梦和快( kuài)手的可灵作为 AI 文生视频( pín)工具也已存在多时,并在( zài)国内用户增长和产品功( gōng)能上迅速迭代,正因如此( cǐ),当 Sora2 引爆话题之时,社交媒( méi)体上也传出了大厂国庆( qìng)连续加班研究的消息。

Sora2 生( shēng)成视频
于今其所要面对( duì)的问题是,在 Sora2 已经将“ AI 生成( chéng)视频工具”升级为“ AI 内容平( píng)台”的今天,谁能最先在国( guó)产赛道上拿出可对标的( de)产品?或许这一次的战略( lüè)性“对标”,反而能够为其始( shǐ)终未能找到出路的 AI 内容( róng)真正解套。
从模型到平台( tái):
Sora2 为何成为“现象级产品”
要( yào)理解 Sora2 所引起的轰动效应( yīng),必须先认识到它带来的( de),其实并非单纯意义上“视( shì)频生成能力”的升级,反而( ér)是长久以来对于“ AIGC 内容”叙( xù)事范式的再定义。
首先,Sora2 在( zài)内容生产的维度上实现( xiàn)了质变。
它最大的突破在( zài)于“音画同步”和“物理一致( zhì)性”的双重跃迁:视频中的( de)光影、重力、碰撞、镜头语言( yán)都比前代自然得多,甚至( zhì)连人物对话、背景音效、情( qíng)绪氛围都可以自动生成( chéng)。

这意味着 AI 第一次具备了( le)“编导级”的综合叙事能力( lì)——不仅能“画出”一个世界,还( hái)能“让这个世界活起来”。在( zài)传统影视行业,这相当于( yú)从一支美术团队变成了( le)一个完整的制作公司。
其( qí)次,Sora2 的产品形态本身更具( jù)战略意味。
OpenAI 没有让它停留( liú)在“ API 模型”或“开发者工具”的( de)层面,而是直接推出了 Sora App,一( yī)个具备创作、分发、互动、推( tuī)荐等功能的“ AI 原生内容平( píng)台”。
这一决策背后是对未( wèi)来互联网内容生态的深( shēn)刻洞察:AI 不只是生产力工( gōng)具,更是平台竞争的新核( hé)心。当生成能力与分发逻( luó)辑绑定,创作者行为就会( huì)被平台设计重新塑造,生( shēng)态壁垒也将因此建立。

Sora App 截( jié)图
接着,Sora2 的“ Cameo ”功能进一步拉( lā)近了人与 AI 内容的距离。
用( yòng)户只需上传一张人像或( huò)一段音频,AI 就能在生成的( de)视频中“代入”你的形象。“自( zì)我投射”的能力,使 AI 视频不( bù)再只是“看”的内容,而是“参( cān)与”的内容。这是“用户创作( zuò)行为的彻底重构”——它把创( chuàng)作门槛降到零,同时激活( huó)了人类最本能的表达欲( yù)望。
最后,也是最具产业级( jí)意义的一点:Sora2 的社交属性( xìng)使其从“工具”变成了“平台( tái)”。
它不再仅仅只是一个 AI 文( wén)生视频大模型,而是一个( gè)内容分发系统;它不只是( shì)为创作者服务的 API,而是一( yī)个可能吸引数亿用户日( rì)活的短视频入口。

可以说( shuō)正是这一架构使其对 Meta 和( hé) Tiktok 产生了结构性威胁,因为( wèi)它有潜力从根本上重塑( sù)短视频平台的竞争格局( jú)——当“视频生产”本身不再是( shì)人的专属能力,平台之间( jiān)拼的就不再只是内容,而( ér)是“生成 + 分发”的一体化体( tǐ)验。
并且,OpenAI 可以毫无包袱的( de)去做这件事,毕竟对他们( men)来说,将更具娱乐消费属( shǔ)性的 Sora 与生产力属性更强( qiáng)的 ChatGPT 区隔开来,反而有助于( yú)两个平台各自的有效增( zēng)长。
追兵的机会与困局:
即( jí)梦 vs 可灵
如果说 OpenAI 的 Sora2 为全球( qiú) AI 视频赛道树立了新的标( biāo)杆,那么,在中国市场,最有( yǒu)机会追上的,显然是字节( jié)跳动的即梦 与快手的可( kě)灵。
两者都已经迈出了第( dì)一步,但前路各有优势与( yǔ)短板。
从基础能力看,即梦( mèng)更像是“产品派”的代表。
它( tā)背靠字节的剪映、抖音生( shēng)态,具备天然的分发入口( kǒu)和用户场景优势。即梦的( de) Seaweed 模型已经支持文本生成( chéng)视频、动作模仿、多模态参( cān)考等功能,平台内还集成( chéng)了创作、编辑、分享的完整( zhěng)生产链条。

即梦 AI 制作的短( duǎn)片《权利童话》
字节的强项( xiàng)显然不在于最前沿的模( mó)型研发,更多还是依靠产( chǎn)品逻辑做成生态闭环:只( zhǐ)要生成质量达到“可用”水( shuǐ)平,就可以借助抖音的流( liú)量分发迅速起量。这也是( shì)为什么即梦虽然相对后( hòu)发,却同样能够快速获得( dé)大批用户青睐。
它的短板( bǎn)同样明显:目前的即梦在( zài)音画同步、物理细节、长时( shí)视频一致性上,仍与 Sora2 甚至( zhì)是可灵存在着差距。更重( zhòng)要的是,抖音如此巨大的( de)体量之下,除非是 AI 视频的( de)确有什么巨大突破,否则( zé)很难说服大部分用户必( bì)须用即梦来做视频。
可灵( líng)的路线则更偏“技术派”。

可( kě)灵 AI 生成视频截图
快手从( cóng)一开始就强调模型层面( miàn)的突破:在 2.0 版本中,可灵引( yǐn)入了多模态视觉语言(MVL)、多( duō)图参考、3D 轨迹控制等技术( shù)模块,目标是逐步接近 Sora2 的( de)生成质量。
更重要的是,可( kě)灵已具备生成数分钟长( zhǎng)视频和复杂镜头语言的( de)能力,并开始探索“视频续( xù)写”“镜头编排”等更贴近影( yǐng)视制作的方向。从技术潜( qián)力来看,可灵也许比即梦( mèng)更接近“对标产品”的目标( biāo)。
然而,快手需要面对的是( shì)生态问题:它的分发能力( lì)和创作者生态不如字节( jié)庞大,平台对用户生成内( nèi)容的承载能力相对有限( xiàn)。换句话说,可灵或许能先( xiān)跑出“模型层面的对标”,但( dàn)未必能先跑出“产品层面( miàn)的平台”。

可灵 AI 单元故事集( jí)《新世界加载中》
然而,真正( zhèng)制约这场竞争走向的,或( huò)许并不是技术,更多还是( shì)商业层面的考量。国内 AI 文( wén)生视频目前最大的困境( jìng)在于,依然没有找到真正( zhèng)的商业模式。
根据快手发( fā)布的 2025 年第二季度财报显( xiǎn)示,可灵 AI 在该季度的营收( shōu)达到了 2.5 亿元,较去年有了( le)数倍增长,然而,影响的客( kè)户其实依然还是专业机( jī)构或是自媒体。本质上来( lái)说,AI 视频生产工具并不属( shǔ)于大众消费产品。
即便是( shì)过去一年被寄予厚望的( de)“ AI 短剧”,也没有演化出一个( gè)足够有规模、有利润的生( shēng)态系统。多数项目仍然依( yī)赖补贴或营销预算驱动( dòng),无法自我造血,用户的留( liú)存和付费意愿也远未验( yàn)证。在这种背景下,如果让( ràng)文生视频作为“功能模块( kuài)”嵌入到抖音、快手等主平( píng)台之中,便很难成为业务( wù)增长的新支点。

用户生成( chéng)的 AI 短剧
更重要的是,如果( guǒ)让抖音和快手本体直接( jiē)承担 AI 视频生产的任务,不( bù)仅面临注意力被稀释、用( yòng)户体验受影响的风险,也( yě)会引出复杂的伦理与法( fǎ)律问题——例如真人视频与( yǔ) AI 视频的混杂如何标注、内( nèi)容责任如何界定、算法推( tuī)荐是否应区分来源等。
正( zhèng)因如此,从产品形态的角( jiǎo)度来看,打造一个“只允许( xǔ) AIGC 视频存在”的独立平台,不( bù)仅是未来竞争的方向,也( yě)可能是行业走向成熟的( de)必要条件。
Sora2 的出现,让“ AI 视频( pín)”从技术演示变成了行业( yè)主战场。它不只是重新定( dìng)义了“内容怎么生产”,还在( zài)重塑内容如何被分发、创( chuàng)作者如何被激发、平台如( rú)何被重构。

对于抖音和快( kuài)手而言,压力同样来源于( yú)需要用 AI 产品来和自己原( yuán)本的内容平台打擂台,这( zhè)其实是 OpenAI 所不需要考虑的( de)问题,毕竟它只是从零开( kāi)始去颠覆,才能够如此不( bù)管不顾。
这倒是也是为什( shén)么按照国内产品“对标”的( de)能力,原本以为加班一个( gè)国庆大概就应该已经有( yǒu)类似产品的 1.0 版本出现,但( dàn)快两周过去,大家依然还( hái)是热火朝天的在讨论 Sora2,却( què)没见到两家大厂的跟进( jìn)动作。
理论上来看谁愿意( yì)先做出真正意义上的“国( guó)产 Sora2 ”,其实也决定两家公司( sī)各自的 AI 战略走向,更重要( yào)的是在 AI 创作内容这个层( céng)面,“视频”始终还是皇冠上( shàng)的明珠,无法在这一能力( lì)上占得一席之地,其实到( dào)头来也很难说把“ AI 故事”讲( jiǎng)完整。









