谷歌开源 Gemma 4:手机端 AI 新玩法与产业变革信号

张开发
2026/4/7 9:57:32 15 分钟阅读

分享文章

谷歌开源 Gemma 4:手机端 AI 新玩法与产业变革信号
【导语谷歌开源新模型 Gemma 4采用与 Gemini 3 同源架构支持全模态多个小型号可在手机端本地运行速度惊人但在复杂任务上存在不足未来或引发 AI 产业商业模式洗牌。】手机端的「Gemini 平替」谷歌开源的 Gemma 4 采用与 Gemini 3 同源的技术架构支持原生全模态在 Arena AI 排行榜上位居全球第三。其较小的 E2B有效参数 2.3B和 E4B有效参数 4.5B型号可直接部署在手机端本地运行上下文窗口达 128K被称为「可以放进口袋的 Gemini 平替」。模型发布后迅速成为手机用户的新宠有 X 用户在 iPhone 上本地运行 Gemma 4 处理图片、音频等速度惊人。在苹果芯片配合 MLX 框架下推理速度超 40 token/秒三星 Galaxy 上也有类似表现让手机端运行 AI 模型成为可行选项在医疗等敏感场景有重要作用。运行便捷与安全保障运行 Gemma 4 小模型非常简单谷歌发布了官方 App——Google AI Edge Gallery用户下载该 App 并选择想要的模型版本即可运行且因是官方发布安全有保障。复杂任务的短板在更强硬件上运行更大版本的 Gemma 4如在 M5 Pro 版本的 MacBook Pro 上运行 Gemma 4 Mixture - of - Experts 26B直接对话时速度较快但当成 coding agent 使用时因需要大上下文256k、复杂 prompt 和稳定工具调用Gemma 4 常出现卡住、报错或输出结构不对的问题。相比之下qwen3 - coder 在同样环境下能正常完成文件创建、命令执行等多步任务。产业变革的信号尽管 Gemma 4 在复杂任务上有不足但其作为「性能小钢炮」仍不容小觑。若大量日常任务可本地运行卖 token 的厂商将面临尴尬处境。当前开源模型与前沿闭源模型有差距且受硬件能力限制但长期来看端侧模型会逐步蚕食云端高频简单任务。编辑观点Gemma 4 的开源为手机端 AI 应用带来新活力虽有缺陷但指明了端侧模型发展方向未来将推动 AI 产业商业模式变革促使厂商提升核心竞争力。

更多文章