Claude Sonnet 4.6 — Anthropic 最强 Sonnet

Anthropic 迄今最强的 Sonnet 模型。在编程电脑使用长上下文推理智能体规划方面大幅提升,智能接近 Opus 级别 — 定价不变。

OSWorld 得分
72.5%
上下文窗口
100万 tokens
Claude Code 偏好率
70%
定价
$3 / $15
立即体验

试用 Claude Sonnet 4.6

输入提示词,亲身体验 Claude Sonnet 4.6 大幅提升的强大能力。

每条消息消耗 5 积分
登录后使用
核心能力

Claude Sonnet 4.6 能做什么

编程能力大幅提升,电脑使用接近人类水平,强大的长上下文推理 — 全部以 Sonnet 定价提供。

claude-sonnet-4-6

智能编程

修改代码前先读取上下文,整合重复逻辑而非到处复制粘贴,过度工程化和懒惰行为明显减少。多步骤任务执行更加稳定,虚假成功报告显著减少。

电脑使用

从实验性功能进化为实用工具。OSWorld 基准从 14.9% 跃升至 72.5%。在复杂电子表格和多步骤网页表单上接近人类水平,可跨多个浏览器标签页协调操作。

长上下文推理

百万 token 上下文窗口(测试版)可容纳整个代码库、长合同或数十篇研究论文。Sonnet 4.6 能在如此长的上下文中有效推理 — 而不仅仅是塞入文本。

基准测试

基准测试表现

全面提升,接近 Opus 级别性能,在电脑使用和编程方面表现突出。

电脑使用
72.5%

OSWorld

从 14.9% 提升到 72.5%,接近真实软件环境的人类水平

编程
70%

Claude Code 偏好率

70% 的 Claude Code 用户更偏好 Sonnet 4.6 而非上一代 Sonnet 4.5

编程
59%

对比 Opus 4.5

59% 的用户在编程任务上更偏好 Sonnet 4.6 而非旗舰版 Opus 4.5

智能体规划
第一

Vending-Bench Arena

展示战略性商业模拟 — 前期大力投资扩容,后期适时转向利润优先,以时机优势超越竞争对手

长上下文
100万

上下文窗口

百万 token 上下文窗口(测试版),可容纳整个代码库和长文档

性价比
高性价比

定价

接近 Opus 级别的表现,同时保持出色的性价比

核心功能

Claude Sonnet 4.6 核心功能

从编程到规划,从安全到规模,每个维度都得到了全面升级。

接近 Opus 级别的智能

所有基准测试全面提升。以前需要 Opus 的任务现在可以用 Sonnet 完成 — 以每百万 token $3/$15 的 Sonnet 定价。

百万 Token 上下文(测试版)

足以容纳整个代码库、长合同或数十篇研究论文。Sonnet 4.6 能在长上下文中有效推理,支持复杂的长期规划任务。

提示注入防御增强

与 Sonnet 4.5 相比,抵御提示注入攻击的能力显著提升。恶意网页在电脑使用任务中更难劫持模型。

智能体规划

多步骤任务执行大幅改进。更擅长协调智能体团队、提前规划,以及在无需人工干预的情况下从错误中恢复。

增强的网络工具

网络搜索和抓取工具现在自动过滤和处理搜索结果,只保留相关内容以节省 token。代码执行、内存和工具使用已正式发布(GA)。

定价不变

尽管全面改进,定价仍为每百万输入 token $3,每百万输出 token $15 — 与之前的 Sonnet 模型相同。

为什么选择

为什么使用 Claude Sonnet 4.6

在性能与成本之间取得平衡,适合高频工程任务与电脑操作自动化场景。

高性价比的工程能力

在日常编码、重构与问题排查任务中,能提供接近旗舰级别的稳定输出。

电脑操作自动化能力强

适合处理多步骤网页操作、表格流程和重复业务动作。

长上下文任务更连续

支持 1M 上下文,有助于在长会话中保持任务目标与信息一致。

如何使用

Claude Sonnet 4.6 的落地方法

通过可执行提示结构,提高自动化与编码场景下的稳定性和交付效率。

1

先写流程再发起任务

先定义输入、步骤、输出格式和异常处理条件,再交给模型执行。

2

长文档分段并标优先级

对长上下文资料分层组织,并标注关键证据来源,提升推理聚焦度。

3

持续跟踪质量与成本

按场景监控 token、时延与完成率,持续优化模型选择策略。

常见问题

还有更多问题?联系我们的支持团队。

还有问题?

我们的支持团队随时准备为您提供帮助。

联系支持

在 Fluxchat 上体验 Claude Sonnet 4.6

在 Fluxchat 上试用 Anthropic 最强的 Sonnet 模型,用于编程、电脑使用、研究和日常工作。