文 | 互联网江湖,作者 | 志刚
最近,AI 视频生成领域迎来了一连串的大动作。
先是北京爱诗科技有限公司正式宣布完成 6000 万美元(约合 4.3 亿元人民币)B 轮融资,刷新了国内视频生成领域的单笔融资额纪录。
然后是另一家明星初创企业——生数科技也宣布完成了数亿元人民币 A 轮融资,由百度、启明创投等多家知名投资机构共同参与融资。
至于老牌玩家快手可灵,则是推出了全新的数字人功能。
据了解,其和过去常见的 AI 主播们有着本质的不同,现在用户只需要一张角色图片加一段文字或音频,就可生成 1080p/48FPS、最长 1 分钟的数字人视频,同时还能够实现口型精准同步与情绪动作的精细控制,做到角色的 " 神形兼备 " ……
至此,从资本 " 弹药 " 补充,到技术创新突破,AI 视频生成行业也已经为下一次的爆发,做好了准备。
那么既然这样,未来,谁又能够领跑全场?
AI 视频生成 " 分野 ":小厂重产品,大厂重生态
从去年 2 月,OpenAI 发布人工智能文生视频大模型 Sora 震撼全场,到现在,AI 视频生成赛道已经走过了近两年的爆发期。
虽然整体格局尚未完全明朗,但是就模型性能表现而言,现在第一梯队的玩家们基本已经稳了下来。
结合两张业内比较认可的榜单(国际测评机构 Artificial Analysis,以及由多所国内顶尖高校和研究机构联合发布的 AGI-Eval),现在全球排名前 10 的视频生成模型,除谷歌外,剩下的都被国产玩家们包圆了。
二是国内的初创企业们,以北京的爱诗科技(PixVerse V5)、上海的 MiniMax(Hailuo 02 Pro)两家为主。
其中,一个反直觉的表现是:在同样是今年 6 月、8 月的模型更新中,无论是文生视频,还是图生视频," 小厂 " 爱诗科技们的排名反而要比字节们更好。
这种反超,实际上也是 AI 大小厂们对视频生成赛道发展 " 分野 " 的表现。
1、现在的爱诗科技们更偏向于产品主义、工具思维。
这种选择跟其初创企业的身份有关。由于资金、人才等核心资源有限,所以品牌企业只能把重心放到模型产品方面,不断打磨 AI 能力,集中提升视频生成的速度、质量和指令遵从优化等方面。
同时,按爱诗科技创始人王长虎的说法,现在爱诗聚焦的用户,是没有视频制作技术的普通人。他把目前的产品也比作是视频生成界的 Canva,对应的是 Photoshop 和 Figma。
从这个角度看,爱诗科技们想做的,似乎是一个瞄准 C 端用户的超级 AI 工具。
那么参考过去互联网时代的经验,工具类 APP 无疑是个苦逼的商业模式。比如墨迹天气、WiFi 万能钥匙、豌豆荚、91(手机)助手们,无不是前期风光无限,但在移动互联网后期几乎没有护城河可言。
要么核心功能被手机厂商们直接整合,要么商业模式单一,天花板有限,无法将海量用户转化为有效收入……
当然,AI 视频生成也是有成为内容社区潜力的,只不过想要真正实现一句话生成一部大片,技术上还有很长一段路要走。
此外,互联网江湖团队在亲自体验了几家 AI 生成视频平台后,还发现了一些问题:在一个全部都是 AI 生成的视频社区中,同质化、审美疲劳的问题尤为明显," 刷十几个就刷不动了,感觉没意思了 "。
同时,由于大家都是技术流,所以整个社区氛围缺少 " 人味 ",缺乏第三方吃瓜群众的欣赏和评价,创作者们得不到太多物质和精神上的激励,这也让很多人又把 AI 视频搬运到了抖音,快手和 B 站等平台上。
AI 内容制作平台与内容分享平台,似乎被大众用户自发地隔开了。
2、相比之下,作为互联网时代的 " 过来人 ",谷歌、字节和快手们在 AI 视频生成赛道的押注更加全面,不只是注重产品表现,同时还更关注生态布局。
一方面,向内寻找跟自身原有业务的协同效应。比如谷歌的最新视频生成模型 Veo 3.0,就不是作为独立产品推出的,而是被深度整合到名为 Flow 的 AI 电影制作工具中。
其中,Flow 还汇集了 Imagen(文生图)和 Gemini(通用)两大模型,旨在推动用户实现从文本故事输出到镜头控制、视频生成等一系列 AI 无缝创作。
无独有偶。从豆包大模型到即梦、剪映、Seedream 4.0,再到抖音,字节同样围绕内容生产、分发、消费和商业化打造出了一套可闭环的 AI 生态系统……
另一方面是,向外探索 AI 视频生成业务的独立想象力。
最典型代表就是快手可灵,瞄准的游戏制作、专业影视制作等商业化场景已经初见想象力。
比如今年 6 月,可灵 AI 与快手星芒短剧联合出品了全球首部 AI 单元故事集《新世界加载中》,全球累计播放量近 2 亿次。
又比如在 8 月份的业绩说明会上,快手方面透露,二季度,可灵 AI 又与网易游戏旗下热门手游《逆水寒》达成了深度合作,将 AI 视频生成能力内置于游戏中,丰富游戏的社交玩法。
在这样的背景下,快手可灵也成了行业内少有的、敢于公布 AI 业绩的公司。
天眼查 APP 显示,二季度财报,快手旗下的可灵 AI 单季度收入突破 2.5 亿元,较一季度的 1.5 亿元环比增长 66.67%。对应的,其 2025 年全年收入目标也较年初设定值翻倍,同时推理算力投入亦同步翻倍,且已实现毛利率为正……
原因在于AI 视频生成行业的格局还不够稳定,还存在很多的不确定性。
一是技术层面,现在各大视频生成模型的能力仍处于快速演进期,距离理想中的表现还差得很远。那么在后续的 AI 竞赛中,谁又能保证会一直领先?
二是潜在的竞争对手威胁。要知道,现在很多 AI 大模型实力玩家还没有下场发力。比如百度,此前李彦宏坚决不跟进 Sora,就是因为 AI 视频生成的商业化可能要五年甚至十年之久。但现在,一切都被加速了,那么对于旗下有爱奇艺的百度来说,会不会进一步加码呢?
此外,腾讯也是一大关注对象。虽然现在还没有太多的布局,但当初在语言大模型上,腾讯不也是观望了很久?直到 DeepSeek 出世,元宝迅速跟进并整合进微信,直接摘了最大的果子。
所以,不管是大厂还是小厂,AI 视频生成行业都还没有到终局的时候……
从广告公司到电商公司,再到 AI 公司
其实从前段时间科技股的大涨,以及最近各大科技巨头们密集加码 AI 的动作,不难发现:
互联网公司,未来的必然之路就是成为一家真正的 AI 公司。
这个 AI 公司,不是说通过 AI 去赋能广告业务,提升电商的匹配效率,而是AI 业务的占比越来越高。
就像此前涨得最猛的百度,资本市场之所以认可,背后有昆仑芯片业务爆发的带动,也可能有 AI 等业务占比突破的影响。
今年第二季度,百度在线营销收入为 162 亿元,同比减少 15%;非在线营销收入为 100 亿元,同比增长 34%,主要受智能云业务增长带动。
如果算上爱奇艺,那么后两项业务营收占比就超过了 50% ……
此外还有腾讯,以前是靠微信连接一切,但在上周,腾讯突然宣布全面开放 AI 能力,助力 " 好用的 AI" 在千行百业中加速落地,整体也开始朝着 AI 连接一切的 2.0 时代迈进。
其实某种程度上,现在整个互联网行业也都到了向 2.0 时代进化的关头。
比如今年 9 月以来,阿里巴巴等互联网企业们都在纷纷加大债券融资力度,加码 AI 投资布局,为将来的 AI 竞赛储备 " 粮草 "。
至于海外,最近英伟达也与 OpenAI 宣布建立了战略合作伙伴关系,投资千亿美元部署 10 吉瓦算力。同时今年第二季度,谷歌在云收入同比大涨 32%,资本开支达 224.46 亿美元的背景下,又上调了全年资本开支 100 亿美元至 850 亿美元。
相同反应的,还有微软、Meta、亚马逊等一众科技巨头们。
这些无不说明,AI 就是进入下一个时代的门票。
在此背景下,回到视频生成赛道来看,现在率先跑出来的可灵 AI 对快手就显得尤为重要了。
一方面,这就相当于快手 AI 战略的桥头堡、是未来的第二增长曲线,跟夸克之于阿里一样重要,是最难的用户应用层的突破。
可以预见到的是,在技术(资本)、生态和商业化三要素率先集齐的优势下,可灵未来的营收飞轮也将随着 AI 时代的普及,以及视频生成技术的进化而越转越快。
毕竟,前者带来用户的广度,后者则是用户深度绑定的关键,现在两者都处于快速上升期,那么 AI 视频生成的 " 蛋糕 " 自然也会越做越大。
所以,快手把可灵 AI 提级可能只是一个开始,未来可灵的战略重心还会越来越高,这是 AI 时代走向所决定的。
另一方面,可灵还可以看做是快手的抵御型护城河。
为什么这么说?
在传统模式下,平台是 " 内容的集市 ",核心任务是吸引更多卖家(创作者)并帮他们找到买家(观众)。
而AI 视频生成的成熟,则意味着 " 内容货源 " 的获取方式可能会发生根本性变化。
此时,平台就不能仅仅是一个集市,它还需要具备 " 自营生产 " 甚至 " 提供先进生产工具 " 的能力。因为如果未来用户的消费偏好转向由 AI 驱动的新型视频(如高度个性化的互动叙事),但平台自身缺乏这种核心生产能力,那么其对应的生态活力与用户粘性是不是就将面临严峻挑战 ?
这个逻辑和网约车平台面临无人驾驶技术的冲击如出一辙。网约车的旧模式是整合零散的司机资源,而无人驾驶则可能将供给方变为高度集中的技术提供商。
如果网约车平台在技术变革中缺位,最终就有可能沦为纯粹流量入口,价值被大幅挤压。
所以在战略重要性上,无论是快手可灵,还是滴滴自动驾驶们都必须全力以赴。
就像以前的微博大战那样,当时腾讯、网易、搜狐等一众互联网巨头们都在做 " 微博 ",但为什么最后跑出来的是新浪?
很重要的一点在于:对腾讯们来说,做微博只是尝试性业务,有更好,没有也不会影响根本。
但对新浪而言,当时微博几乎就是他的唯一业务,所以只有全力以赴,才可能取得成功。
这可能也解释了前段时间可灵 AI 换帅的原因。
毕竟打过仗的都知道,每逢大战,换防就是必然的事儿。也只有把合适的人,放到合适的位置上,才不会在关键时刻掉链子。
至此,大模型生成视频,可以看作是推动互联网向 2.0 时代迈进的关键一步。
也只有走出这一步,AI 才能从一个技术工具,逐渐演化为新内容世界的底层语法,催生出人机共创的全新范式。
这场变革的终点,并非取代谁,而是开启一个更具想象力的内容新大陆。
时至今日,探索者们的地图,仍在大面积留白……