同样是 Opus 4.5,为什么回答不一样?
我问了同一个问题。
「微软的股价盘后为什么跌了?」
一个是 Claude 官方 App。Anthropic 出品,用的是 Opus 4.5。
另一个是我的 Clawdbot。开源 AI Agent 框架,也是 Opus 4.5。
同一个模型。同一个问题。
理论上,答案应该差不多。
但实际上,完全不一样。
Claude App 给了我三点原因。Azure 增速放缓。产能限制。资本支出增加。来源是 CNBC。
没毛病。标准答案。
Clawdbot 给了我具体数字。EPS 多少,预期多少,beat 了多少。Azure 从 40% 降到 39%。Capex 实际 375 亿,预期 343 亿。
还引用了 Twitter 上分析师的原话。
「The bottleneck isn't demand; it is Physics. They literally cannot build data centers fast enough.」
然后加了一个对比:同一天发财报,Meta 涨了 5%,微软跌了 5%。
一个是「回答问题」。
另一个是「帮我理解问题」。
为什么会不一样?
不是模型的问题。是「装备」不一样。
Claude App 用的是传统搜索。跑去 Google,找到 CNBC 的新闻稿,总结给你。
Clawdbot 用的是 Twitter。分析师看到财报的第一时间就发推了。比新闻稿快,比编辑审核快。
第一手信息和二手信息,质量不一样。
还有一个更深的原因。
Claude App 不认识我。
每次对话都是全新的。它不知道我喜欢什么风格。不知道我的技术水平。不知道我在用手机看,屏幕很小。
Clawdbot 认识我。
它有配置文件,写着「不要说废话,直接给答案」。它知道我是谁。知道我喜欢简洁。知道我在用 iMessage。
所以它的回答,是为我定制的。
同一个模型,不同的「装备」。
Claude App = Opus 4.5 + 基础搜索 + 无配置
Clawdbot = Opus 4.5 + Twitter + 自定义配置 + 记忆 + 用户偏好
模型只是引擎。
工具和配置,决定了输出质量。
就像两辆车用同一款发动机。一辆是原厂配置,一辆是改装版。跑出来的成绩,不一样。
如果你只是偶尔问问题,Claude App 够用了。
但如果你想要更实时的信息、更符合你习惯的输出格式、记住你的偏好、更多工具能力——
你需要的是一个 AI Agent,而不只是一个 Chatbot。