��事件:6月10日,Anthropic正式发布Claude Fable 5/Mythos 5模型,模型打分刷新各大基准测试。
1⃣AI Coding、长任务等打分领先。Mythos&Fable 5具备长自主运行时间,在软件工程、知识型工作、视觉等领域能力领先,擅长超长上下文、生命科学研究场景,其在Agentic coding测评打分为80.3%,显著超过Opus 4.8(69.2%)、GPT 5.5(58.6%)、Gemini 3 Pro(54.2%)。据官方案例,新模型可一天完成5000万行Ruby代码库迁移任务,比人工团队节省2个月+时间。
2⃣注重Token效率,擅长复杂任务。Fable 5 的Token效率高于历史模型,FrontierCode评估中,高质量代码生成效率第一。1)科研场景:Fable 5仅使用了1/3的推理Token,在36小时内产出的物理研究成果,就逼近了GPT-5.5耗时四天跑出的成绩。2)金融场景:在量化交易大厂IMC和Optiver的实测中,Fable 5几乎拿满了其交易分析评估的全部权重,包括事实检索、概念推理和期望值计算。
3⃣侧重AI安全,新模型加量不加价。新发布的Fable 5中加入了安全限制,当涉及网络安全风险任务时会回退至Opus 4.8模型;Mythos 5目前供小部分网络安全防御者、基础设施提供商使用,与Fable 5采用了相同的底层模型,在一些方面取消了安全限制。两款模型输入为10美元/百万Token,输出为50美元/百万Token,较Mythos预览版优惠超过50%,与Opus 4.8快速版价格一致。
注:据公开资料整理,不涉及研究观点和投资建议。
1、本站部分资源源自互联网,如内容存在侵权行为或未标明出处的情况,您可通过邮箱 meiritouyan@qq.com 与我们联系,我们将尽快进行处理。
2、如遇本站资源无法下载、无法查看,请及时联系我们,我们将第一时间修复。
