快手可灵月活破780万登顶，OpenAI却砍掉Sora押注“土豆”：AI视频生成迎来“中国时刻”

张开发

• 2026/4/8 5:59:18 • 15 分钟阅读

分享文章

快手可灵月活破780万登顶，OpenAI却砍掉Sora押注“土豆”：AI视频生成迎来“中国时刻”

一边是快手可灵AI以780万月活登顶全球AI视频生成工具榜首商业化年收入运行率突破3亿美元另一边是OpenAI悄然关停Sora转而曝光代号“Spud”土豆的全新预训练模型声称要打造“超级应用”。2026年春天AI视频生成赛道迎来戏剧性转折——国产多模态应用正在全球市场高歌猛进而曾经的行业标杆却选择战略性撤退。这背后究竟是一场技术路线的分化还是商业逻辑的重新洗牌一、可灵登顶国产AI视频的“逆袭时刻”1.1 数据说话780万月活断层领先市场情报机构Sensor Tower的最新数据显示快手旗下AI视频生成应用可灵AI在2026年3月的移动端月活跃用户MAU已达到780万而同期OpenAI的Sora仅为470万。更值得注意的是这还是在Sora关停之前的数据——在Sora正式退出舞台后可灵的领先优势进一步扩大。增长势头同样强劲仅3月最后一周可灵全球周活跃用户WAU环比增长4%平均规模达260万。这一数据标志着可灵已成功登顶全球移动端AI视频生成工具的“新王座”。1.2 商业化爆发ARR破3亿美元年收入有望翻倍用户规模的领先直接转化为商业化的爆发。据快手2025年第四季度财报显示可灵AI第四季度收入达3.4亿元全年总收入突破10亿元关口。更令市场瞩目的是快手科技创始人兼首席执行官程一笑在业绩电话会上透露截至2026年1月可灵的ARR年化收入运行率已突破3亿美元公司对今年实现收入同比翻倍以上增长有较强信心。从收入结构来看可灵已经形成了清晰的商业化路径个人订阅C端用户付费使用视频生成功能企业API为专业创作者和企业客户提供底层能力生态赋能与快手内容生态深度融合形成闭环广发证券分析认为可灵AI在视频生成领域保持第一梯队优势模型迭代和商业化或超预期有望成为快手中长期新增长曲线。1.3 技术底气为什么是可灵在技术层面可灵的核心竞争力体现在三个维度角色一致性可控性AI视频生成最大的痛点之一是角色在不同场景下的形象一致性。可灵通过多模态视觉语言MVL理念实现了文字、图像、视频等多模态的指令输入确保角色在长视频中的稳定呈现。物理真实感算法针对真实物理世界进行了深度建模生成的动态画面符合物理规律避免了AI视频常见的“飘忽感”。复杂场景稳定性在高复杂度场景如多人互动、快速运镜中保持输出稳定这正是专业级用户的核心诉求。技术演进路径清晰可见从可灵2.0的MVL理念到O1模型的多模态交互深化再到3.0系列的All-in-One统一框架快手正沿着统一原生多模态方向持续迭代。1.4 Sora“离场”后的权力交接可灵的崛起恰逢Sora的战略性撤退。此前Sora的关停在全球AI创作者群体中引发了巨大反响留下的市场真空迅速被可灵等国产工具填补。这一“权力交接”背后反映了中美AI应用路线的分化美国巨头更倾向于押注底层模型突破而中国企业则在应用场景和商业化落地上走得更快。正如行业观察者所言这是视频生成领域的“中国时刻”。二、OpenAI的“土豆”战略砍掉SoraAll-in AGI2.1 Sora为何被边缘化就在可灵高歌猛进的同时OpenAI却做出了一个令人意外的决定——关停Sora将其研发团队并入机器人领域。OpenAI联创兼总裁Greg Brockman在近期播客中首次详细解释了这一战略调整的原因“我们到了一个节点——技术已经验证可行但必须进入真实世界。在算力有限的情况下同时推进两个差异巨大的产品分支非常困难。”核心逻辑很清晰OpenAI确信文本模型可以走向AGI而视频生成Sora与核心推理模型GPT系列在技术架构上是不同的分支。与其分散资源不如将所有火力集中在一条路径上。Brockman透露一位物理学家研究了很久的难题OpenAI模型在12小时内就给出了解决方案。这种“思考”能力让他们必须加倍下注。2.2 “土豆”Spud是什么取代Sora的是一款代号为“Spud”土豆的全新预训练模型。这并非简单的GPT-X迭代而是凝聚了OpenAI过去两年心血的全新架构。根据多方爆料X平台iruletheworldmo等GPT-6即Spud的核心参数如下特性参数架构“Symphony”原生多模态上下文窗口200万Token性能提升较GPT-5.4全面跃升约40%预训练完成2026年3月17日预计发布2026年4月14-16日定价输入$2.5/百万Token输出$12/百万Token更关键的是GPT-6被定位为AGI的“最后一公里”。Brockman表示迈向AGI的进度已完成约80%而GPT-6就是剩下的那20%。2.3 技术突破200万上下文与System-2推理GPT-6的核心技术突破集中在三个方面200万Token上下文窗口采用“分层稀疏注意力”与“滚动记忆缓存”技术可一次性处理整本书、完整项目文档或超长视频。这相当于GPT-5.4的两倍容量。System-2逻辑引擎新增双系统推理架构——System-1负责直觉式快速响应System-2负责内部逻辑校验和事实核查。官方宣称幻觉率可降至0.1%以下在数学、医疗、法律等专业领域有望实现“零错误”。Symphony原生多模态文本、图像、音频、视频、3D实现原生统一编码所有信息共享同一向量空间而非传统的“文本为主、多模态拼接”。2.4 “超级应用”OpenAI的终极野心模型之外OpenAI更大的战略是打造一款整合编程、浏览器和ChatGPT的“超级应用”Super App。Brockman描绘了这一应用的愿景“它不仅是工具更是你的‘个人助理’——了解你、与你的目标一致、值得信任。你想让电脑做什么直接告诉它就行电脑会顺应人类而不是人类顺应电脑。”具体规划上超级应用将分步推进起点是Codex应用——它既是通用的智能体框架能调用各种工具又擅长写软件。未来几个月这一框架将接入电子表格、Word文档等知识工作场景。这解释了OpenAI为何砍掉Sora不是视频生成不重要而是在通往AGI的路径上OpenAI选择了“文本→推理→智能体”这条主线。视频能力不会被放弃但将被整合到统一的多模态框架中而非作为独立产品线存在。三、两条路线的碰撞谁是对的3.1 可灵的胜利场景驱动的商业化逻辑可灵的成功验证了一条与OpenAI截然不同的路径以场景驱动技术迭代用商业化反哺研发。快手没有等待“完美模型”诞生而是快速将可灵推向市场在真实用户反馈中持续优化。程一笑在电话会上坦言“当前视频生成在技术和产品层面都远没有到成熟的地步。”但这并不妨碍可灵通过移动端优先的策略抢占C端市场——相比Web端的繁琐操作手机端的随时随地创作更符合大众习惯。数据证明了这一策略的有效性可灵全年收入破10亿元、ARR超3亿美元这在AI视频生成赛道中堪称标杆。更重要的是可灵与快手内容生态形成了正向循环——AI生成的内容有了天然的落地土壤创作者有了变现渠道平台也因此获得差异化竞争力。3.2 OpenAI的豪赌AGI优先的长期主义OpenAI的选择则是另一种极端砍掉所有旁支All-in AGI。Brockman在播客中透露OpenAI内部从2025年12月起一直处于“编程红色警报”状态。原因很简单Anthropic的Claude Code等AI编程产品在真实世界场景中表现出色大量用户被抢走。这让OpenAI猛然意识到——“原来只靠文本真的有可能通往AGI”。于是奥特曼做出了一个大胆决定砍掉几乎所有非核心产品线包括一度备受期待的Sora和与之相关的迪士尼十亿美元合同。所有资源被集中投入到GPT-6Spud的研发中。这是一场豪赌。赌的是只要模型足够强大应用场景自然会来。Brockman对此充满信心“我们已经确信文本模型可以走向AGI——AGI就在眼前今年还会有更强的模型。”3.3 殊途同归未来可能走向融合两条路线看似对立实则可能在未来走向融合。可灵的成功并不否定OpenAI的路线而是展示了在当前技术阶段场景落地和商业化的重要性。即使模型不完美只要找准用户痛点移动端便捷创作、物理真实感、角色一致性就能在市场上占据一席之地。OpenAI的路线则代表了更长远的技术愿景只有突破AGI的瓶颈才能解锁真正颠覆性的应用场景。Brockman透露OpenAI内部正在研发“自动化AI研究员”计划秋季推出能够承担相当比例的科研任务。这种能力显然远超当前的视频生成工具。从技术演进来看双方都在向统一多模态的方向靠拢。可灵从3.0开始采用All-in-One理念将多模态输入输出纳入同一模型框架OpenAI的Spud则从底层实现了文本、图像、音频、视频的原生统一编码。殊途同归——未来的AI模型必然是统一多模态的。四、行业启示AI视频生成的下半场4.1 国产应用的黄金窗口期Sora的退场为国产AI视频工具打开了一个难得的窗口期。可灵的成功证明在AI应用层中国企业完全有能力实现全球领先。这背后的优势是多方面的移动端基因中国互联网公司在移动端产品体验和用户获取上有天然优势内容生态支撑快手、抖音等内容平台为AI生成内容提供了现成的分发渠道和变现路径快速迭代能力中国团队在产品迭代速度和用户反馈响应上更具灵活性爱诗科技的PixVerse V6也已发布在AI视频生成榜单中位列全球第二。国产AI视频工具正在形成矩阵优势。4.2 OpenAI的战略转向AI进入“应用时代”OpenAI砍掉Sora、聚焦超级应用的战略转向释放了一个重要信号AI竞争已从“模型军备竞赛”进入“应用落地”阶段。模型能力固然重要但如何让用户真正用起来、愿意为之付费才是决定胜负的关键。超级应用的战略正是要将OpenAI的技术能力整合为一个统一、易用、高粘性的产品入口。Brockman的比喻很形象OpenAI的模型就像迪士尼的米老鼠是核心IP超级应用则是围绕这一IP打造的“迪士尼乐园”让用户真正沉浸其中。4.3 开发者的新机会对于AI开发者和创业者来说当前的行业格局意味着新的机会短期机会可灵等国产工具正在快速成长围绕其生态的插件开发、模板创作、内容服务等领域存在大量机会。中期机会GPT-6发布后其200万上下文窗口和System-2推理能力将解锁前所未有的应用场景——长文档处理、复杂任务自动化、智能体协作等。长期机会统一多模态模型的出现将模糊文本、图像、视频、音频的边界。能够跨模态创作的“全能型AI应用”将是下一波创业热点。4.4 风险与挑战当然前景并非一片坦途。对于可灵等国产工具挑战在于技术天花板尚未突破。视频生成在角色一致性、长视频连贯性、物理真实感等方面仍有明显局限。一旦OpenAI或其他国际巨头重新加码视频赛道竞争格局可能再次变化。对于OpenAI风险在于过度集中押注AGI路线可能错失应用层的先机。当可灵已经在C端市场站稳脚跟、形成用户习惯时OpenAI的超级应用尚未面世。模型再强如果没有用户和数据飞轮也可能在应用层落后。五、写在最后2026年的春天AI视频生成赛道迎来了真正的分野。一边是可灵以780万月活、3亿美元ARR的成绩单向世界证明中国AI应用的实力另一边是OpenAI壮士断腕砍掉Sora、All-in“土豆”模型为AGI的最后一公里发起冲刺。两条路线各有各的逻辑各有各的赌注。可灵赌的是场景先行、商业反哺OpenAI赌的是技术突破、应用随行。谁能笑到最后答案或许不重要。重要的是这场竞争正在加速AI从技术概念走向真实应用——而这对所有人来说都是好消息。毕竟AGI的终极目标不是谁赢谁输而是让智能真正服务于每一个人。

快手可灵月活破780万登顶，OpenAI却砍掉Sora押注“土豆”：AI视频生成迎来“中国时刻”

最新文章

Z-Image Atelier 中国风水墨画与现代抽象艺术生成效果对比研究

OpenAlternative 内容管理终极指南：从零开始维护高质量开源项目信息库

保姆级教程：用MMDetection的SSD300训练自定义VOC数据集（附完整配置文件修改清单）

嵌入式网络通讯中随机数生成问题解析

Pixel Language Portal 硬件开发辅助：为 STM32 项目自动生成代码注释与文档

Postgres Language Server 在Neovim中的完整配置指南：10分钟快速上手

推荐文章

突破手游操控瓶颈：QtScrcpy虚拟映射技术全解析

Flutter Riverpod：状态管理的新纪元

WintunAdapter 设计解析：一个 VNP 数据面的无锁优雅实现

Arduino二进制模拟时钟库：LED阵列驱动的轻量级时间可视化方案

RP2040硬件加速步进电机控制库picoasyncstepper

minimal-json：嵌入式C语言轻量级JSON解析器

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

别再手动点按钮了！用Java代码一键触发DolphinScheduler工作流（附电商订单处理实战）

零基础玩转GLM-4.6V-Flash-WEB：图文对话AI快速上手实战

OpenClaw技能市场探索：百川2-13B-4bits模型适配技能推荐

AI职场大逃杀：2030年人类仅存的3种职业

seo网络营销与搜索引擎优化的关系是什么

OpenClaw+Qwen3.5-9B智能爬虫：合规数据采集与结构化存储方案

Nunchaku FLUX.1 CustomV3实战：用简单描述生成赛博朋克、水墨风等多样作品

Qwen3-VL-4B Pro效果实测：看图说话、细节识别有多准？

GLM-4.6V-Flash-WEB效果展示：智能识别华硕/戴尔/联想BIOS界面

YOLOv8轻量化设计解读：为什么Nano版本更适合CPU部署

Filter和Interceptor的工作原理

LangChain4j和LangGraph4j对比