DeepSeek V4: 千呼万唤,犹抱琵琶

张开发
2026/4/13 8:11:08 15 分钟阅读

分享文章

DeepSeek V4: 千呼万唤,犹抱琵琶
推测现在线上用到的就是最初专家模式不能上传附件现在已经可以了OCR功能我测试过我的测试案例表明跟Qwen3.6plus比其实还要稍逊色一点点比如对图片的清晰度要求更苛刻一些识别准确率我测试的都是简体中文——但都比市面上可用的其他要好太多。截至2026年4月13日DeepSeek V4尚未正式发布因此也没有官方发布的、与其他一线大模型的直接比对结果。目前网络上广泛传播的评测和对比数据主要源于非官方的社区传闻和“泄露”信息需要谨慎看待。 网传评测信息一览根据非官方渠道如社交平台爆料流传的信息DeepSeek V4在一些关键基准测试上的“声称”成绩如下测试集声称成绩测试重点MMLU92.8%通用知识和多任务语言理解AIME 202699.4%高难度数学推理能力HumanEval~90%代码生成能力据称优于Claude和GPT系列SWE-Bench83.7%真实软件工程场景下的编程与自动化解决能力需要注意的是这些数据并未得到官方证实且曾有过数据造假的案例在引用时需要特别小心。 第三方对比表格参考有第三方技术社区基于公开信息对包括DeepSeek V4在内的主流开源模型进行了参数对比模型总参数量激活参数量上下文长度DeepSeek V4 (网传)~1 万亿 (MoE)约 370 亿100万 TokensLlama 4 Maverick4000 亿 (MoE)170 亿100万 TokensGLM-5.17440 亿 (MoE)400 亿-在性能层面有报告预测其性能能达到GPT-5.4的约90%但API定价仅为GPT-5.4的五十分之一这将是其非常突出的性价比优势。 发布前的论文预热在V4正式发布前DeepSeek团队在2025年末至2026年初密集发表了三篇研究论文普遍被认为是V4的核心技术架构基础Engram条件记忆模块旨在将静态知识的检索与动态推理分离有望提升模型的知识召回效率。mHC流形约束超连接一种新型的连接方式可以提升大型模型的训练稳定性。DualPath推理框架与清华、北大联合提出旨在解决智能体时代AI模型长文本推理时的I/O瓶颈问题。综合各方信息DeepSeek V4计划于2026年4月下旬正式发布。在此之前所有的“官方”评测信息都应视为传闻最终性能和规格有待官方的技术报告和独立第三方评测来验证。

更多文章