探索 AI 写代码极致:Claude Opus 4.1 模型登场,软件工程能力再攀新高峰

发布时间:2025-08-06 15:45:12 来源:互联网

感谢本站网友 Nuc_F、Stephen_233 的线索投递!

本站 8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型,主要改进了编码、推理和执行指令的能力。

Anthropic 表示,Claude Opus 4.1 在 SWE-bench Verified 上(用于评估软件工程准确性)提升到了 74.5%,作为对比,Claude Sonnet 3.7 的准确率为 62.3%,而 Claude Opus 4 的准确率为 72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。

与 Opus 4 相比,Opus 4.1 在大多数功能上都有所提升,特别是在多文件代码重构方面表现尤为突出。本站附上相关数据如下:

Rakuten Group 发现,Opus 4.1 不做不必要的调整或引入新的错误,能够精确地在大型代码库中定位并修正错误。

Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中,比 Opus 4 表现提高了标准差的一个单位,这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。

最新的模型今日起面向 Claude 客户开放,可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。

同时,Anthropic 在社交媒体上表示,计划在未来几周内发布“对我们模型的重大改进”,因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。

本周热门教程

1
《玉女心经2之阴阳和合》:如何通过阴阳和合实现身心健康与情感平衡?

《玉女心经2之阴阳和合》:如何通过阴阳和合实现身心健康与情感平衡?

2025/03/06

2
如何通过《玉女心经2之阴阳和合》找到人生的平衡与和谐:揭示阴阳哲学对情感的深刻影响

如何通过《玉女心经2之阴阳和合》找到人生的平衡与和谐:揭示阴阳哲学对情感的深刻影响

2025/03/05

3
www.17c.com为什么能吸引大量用户共同参与创作与互动?未来平台发展的潜力有多大?

www.17c.com为什么能吸引大量用户共同参与创作与互动?未来平台发展的潜力有多大?

2025/03/18

4
如何利用WordPress建设永久免费网站?详细步骤与实用技巧

如何利用WordPress建设永久免费网站?详细步骤与实用技巧

2025/03/12

5
如何在WordPress上搭建一个永久免费的免费网站

如何在WordPress上搭建一个永久免费的免费网站

2025/03/09

6
如何避免遭遇9·1高危风险免费版网站NBA?教你识别与防范技巧

如何避免遭遇9·1高危风险免费版网站NBA?教你识别与防范技巧

2025/03/17

7
亚洲经典一曲二曲三曲的区别与特点解析

亚洲经典一曲二曲三曲的区别与特点解析

2025/03/10

8
如何巧妙搭配18水蜜桃和大黄瓜:轻松制作营养美味的果蔬佳肴

如何巧妙搭配18水蜜桃和大黄瓜:轻松制作营养美味的果蔬佳肴

2025/02/18

9
Toriblack高氵喷水MV:为何这部作品能突破常规,成为讨论焦点?

Toriblack高氵喷水MV:为何这部作品能突破常规,成为讨论焦点?

2025/02/17

10
“姐姐呀姐姐快停下是什么歌曲?”这首歌的背景与流行原因解析:为何这句歌词如此火爆

“姐姐呀姐姐快停下是什么歌曲?”这首歌的背景与流行原因解析:为何这句歌词如此火爆

2025/02/20