Claude 3.5一夜封神?实测碾压GPT-4

张开发
2026/4/9 8:59:41 15 分钟阅读

分享文章

Claude 3.5一夜封神?实测碾压GPT-4
Claude 3.5一夜封神实测碾压GPT-4摘要就在昨晚AI 圈又发生了一次小型“地震”。Anthropic 在没有任何预热的情况下直接发布了 Claude 3.5 Sonnet。不仅速度飞快而且在多项基准测试中直接干翻了 GPT-4o。更绝的是它带来了一个名为“Artifacts”的新功能让 AI 对话直接变成了工作台。今天二筒就带大家看看这位“新王”到底能不能打以及咱们普通人怎么用它来“摸鱼”提升效率。---一、半夜惊雷AI 界的“新王”登基昨晚本来打算早点睡的结果朋友圈突然刷屏了。大家都在喊一句话“Claude 3.5 发布了GPT-4o 不香了。”说实话这种“狼来了”的话我听得耳朵都起茧子了。毕竟每个月都有新模型说自己是“GPT-4 杀手”结果实测下来连 GPT-3.5 都打不过。但这次不一样AnthropicClaude 的母公司甚至都没发长篇大论的论文直接甩出了一个模型Claude 3.5 Sonnet。这名字就有意思了。之前的 Claude 3 分为 Haiku快、Sonnet中、Opus大。这次直接跳过 3 的迭代发了 3.5 的“中杯”版本而且官方宣称这是目前市面上最聪明的模型之一。我赶紧爬起来实测了一下。首先最直观的感受就是快。真的太快了。那种响应速度让你感觉对面不是在思考而是在背书。以前用 GPT-4o 生成一段代码有时候要等个几秒钟在那“转圈圈”而 Claude 3.5 Sonnet 基本上是字随着光标直接喷涌而出。根据官方数据它在推理、数学、编码等方面的表现直接超过了 GPT-4o 和 Gemini 1.5 Pro。最重要的是它目前是免费开放的只要你注册了 Claude 账号就能直接用。这对咱们普通用户来说绝对是白嫖的快乐。---二、Artifacts这才是真正的“生产力革命”如果说速度和智商只是“量变”那么Artifacts 功能绝对是“质变”。这也是我觉得最值得跟大家细说的功能。以前我们用 ChatGPT 或者其他 AI更像是在“聊天”。你问它答。如果让它写代码它会给你一坨代码块你得自己复制、粘贴、保存、运行。如果让它画图它给你个链接或者 Markdown 代码你还是得自己折腾。但 Claude 3.5 的 Artifacts 做到了什么它把对话窗口变成了一个“工作台”。举个我刚才测试的例子。我对它说“帮我写一个贪吃蛇游戏的网页代码。”如果是以前的 AI它会给你一堆 HTML 和 JS 代码。但在 Claude 3.5 里屏幕右侧会突然弹出一个独立的预览窗口。代码写完的一瞬间那个贪吃蛇游戏直接就在右边运行起来了我可以直接在右边玩游戏甚至可以实时修改。我说“把蛇的颜色改成红色背景改成黑色。”话音刚落右边的画面立马更新。这就意味着AI 不再只是一个“建议者”它变成了一个“执行者”。这对职场人意味着什么*做图表你把 Excel 数据扔给它它直接在右边生成一个可视化的柱状图你可以直接截图放进 PPT。*写文档你让它写个活动策划案它直接在右边生成一个排版好的预览页而不是一堆乱七八糟的 Markdown 文本。*写代码前端开发的同学甚至可以直接在预览窗口里调试简单的组件。这种“所见即所得”的体验是目前 GPT-4o 都没有的。这才是 AI 走向生产力工具的关键一步。---三、实测对比写代码、写文案到底谁更强光说不练假把式。为了验证它是不是真的“封神”我做了两个小测试。1. 代码能力不再是“伪代码”我给 Claude 3.5 和 GPT-4o 出了同一个题目“用 Python 写一个脚本自动整理下载文件夹里的文件按照图片、文档、压缩包分类。”GPT-4o 的表现给出了代码逻辑是对的但是它引用了一个 shutil 库却没处理文件名重复的异常情况。我运行了一下遇到同名文件直接报错。我反馈给它它才道歉并修改。Claude 3.5 Sonnet 的表现它不仅给出了代码还在代码里预先写好了异常处理。它甚至贴心地加了注释“如果文件夹不存在会自动创建如果文件名重复会自动重命名。”这就是“经验丰富”和“刚毕业实习生”的区别。Claude 3.5 的代码更像是老手写的考虑到了实际运行中的坑。2. 中文理解力更懂“人话”我又让它俩写一段文案。题目是“给一个不想上班的打工人写一段心理独白要带点自嘲和幽默不要太丧。”GPT-4o 写的“啊早晨的闹钟又响了。我不想起床被窝是我的避风港……”有点像小学生作文略显生硬。Claude 3.5 写的“闹钟响的那一刻我悟了。我和我的床才是真爱。至于上班那只是为了给我的猫赚猫粮顺便维持我体面人类的身份。只要我摸鱼的速度够快老板的 PPT 就追不上我。”说实话看到“摸鱼”和“PPT”这种词用得这么地道我甚至怀疑Anthropic 是不是偷偷训练了中文互联网语料。它对中文语境的把握真的比 GPT-4o 要更接地气更有“网感”。---四、普通人怎么用手把手教你上手看到这里估计很多朋友手痒了。别急二筒这就给大家整理一份保姆级上手指南。1. 如何访问目前 Claude 3.5 Sonnet 已经向所有用户开放。*网址直接搜索 Claude.ai。*注册你需要一个魔法上网环境懂的都懂以及一个国外手机号或者通过某些接码平台。*免费额度免费用户每天有一定的对话次数限制但对于日常轻度使用完全够用。2. 实用技巧善用“角色扮演”因为 Claude 3.5 的逻辑能力很强建议大家在提问时给它一个具体的“人设”。比如不要只说“帮我改一下这段话”要说 “你现在是一位拥有 10 年经验的新媒体编辑擅长爆款标题和情绪引导。请帮我修改这段文案让它更适合发在小红书上语气要活泼多用 emoji。”你会发现加上人设后它的输出质量会有质的飞跃。3. 玩转 Artifacts如果你想体验那个神奇的预览窗口只需要在指令里加上几个关键词* “生成一个网页……”* “画一个 SVG 图标……”* “创建一个可视化的图表……”只要涉及到代码生成或可视化它大概率会自动触发 Artifacts 窗口。你可以直接在右边看到结果不需要自己再跑一遍代码。---总结Claude 3.5 Sonnet 的发布确实给了 OpenAI 一记重拳。它证明了AI 的竞争不仅仅是参数大小的竞争更是用户体验的竞争。Artifacts 功能的出现让 AI 从“聊天框”里走了出来变成了一个真正的“副驾驶”。对于我们普通职场人来说这是一个巨大的利好。我们不需要懂代码不需要懂复杂的提示词工程只要会说话就能让 AI 帮我们干活。有人问GPT-4o 还值得充钱吗我觉得目前来看如果你主要做图文创作、代码辅助Claude 3.5 可能是更好的选择但如果你需要语音对话、实时视频交互GPT-4o 依然有优势。AI 的发展真的太快了上个月还是 GPT 的天下这个月 Claude 就反超了。作为普通人我们最好的策略就是保持好奇多去尝试。毕竟这些工具最终都是为了解放我们的双手让我们有更多时间去享受生活或者摸鱼。你试用过 Claude 3.5 了吗感觉比 GPT-4o 怎么样欢迎在评论区留言分享你的体验---*我是二筒关注「AI 原来如此」带你用最通俗的语言看懂最硬核的 AI 科技。下期见*

更多文章