事件:2026年6月26日,OpenAI发布GPT‑5.6 Sol模型预览,GPT 5.6全系列包括Sol/Terra/Luna,分别对应旗舰/中端/高性价比版本。受美国政府限制,#首批仅向小部分受信任机构开放API与Codex使用权限,#计划在未来几周内全面推出。
模型能力
【提升1:单一BenchMark超越Mythos 5】
新推出max推理模式,延长GPT‑5.6 Sol的深度推理时间以更适应超长任务,新增ultra模式通过调用子智能体加速复杂任务执行。GPT‑5.6 Sol在唯一披露的编程BenchMark Terminal‑Bench 2.1上刷新全球纪录,#得分88.8%,#调用子智能体ultra模式下得分91.9%,#超越Mythos 5的88.0%。
【提升2:科研、网安场景能力提升,tokens消耗比Mythos更低】
在用于评估长跨度基因组学和定量生物学分析的 GeneBench v1 基准测试得分60.5%,超越GPT‑5.5的51.8%;#大模型真实网安漏洞利用能力测试集ExploitBench表现与Mythos Preview相当, AI安全更受重视
GPT‑5.6预览版已采用分层防护措施,具体配置因模型而异,针对真实世界中的攻击对其进行压力测试,具体防护机制包括包括模型内生拒答训练、生成过程实时网络安全分类器、跨会话账户风险识别、差异化访问权限及持续监控执法,高风险输出会暂停并交由更强推理模型复核。OpenAI投入了超70万小时的等效A100 GPU算力,开展自动化红队测试,防范通用越狱攻击。#在海外对模型安全监管趋严背景下,#保障非恶性用途已成为前沿模型的必要合规项目。
模型定价比Anthropic更优惠
GPT-5.6 Sol/Terra/Luna的API定价为每百万Tokens输入/缓存命中/输出分别为5/0.5/30美元,2.5/0.25/15美元,1/0.1/6美元;相比Anthropic的Fable 5定价为输入/输出 10/1/50美元,Opus 4.8定价为5/0.5/25美元。
1、本站部分资源源自互联网,如内容存在侵权行为或未标明出处的情况,您可通过邮箱 meiritouyan@qq.com 与我们联系,我们将尽快进行处理。
2、如遇本站资源无法下载、无法查看,请及时联系我们,我们将第一时间修复。
