事件:2026年6月26日,OpenAI发布GPT‑5.6 Sol模型预览,GPT 5.6全系列包括Sol/Terra/Luna,分别对应旗舰/中端/高性价比版本。受美国政府限制,#首批仅向小部分受信任机构开放API与Codex使用权限,#计划在未来几周内全面推出。

模型能力

【提升1:单一BenchMark超越Mythos 5】

新推出max推理模式,延长GPT‑5.6 Sol的深度推理时间以更适应超长任务,新增ultra模式通过调用子智能体加速复杂任务执行。GPT‑5.6 Sol在唯一披露的编程BenchMark Terminal‑Bench 2.1上刷新全球纪录,#得分88.8%,#调用子智能体ultra模式下得分91.9%,#超越Mythos 5的88.0%。

【提升2:科研、网安场景能力提升,tokens消耗比Mythos更低】

在用于评估长跨度基因组学和定量生物学分析的 GeneBench v1 基准测试得分60.5%,超越GPT‑5.5的51.8%;#大模型真实网安漏洞利用能力测试集ExploitBench表现与Mythos Preview相当, AI安全更受重视

GPT‑5.6预览版已采用分层防护措施,具体配置因模型而异,针对真实世界中的攻击对其进行压力测试,具体防护机制包括包括模型内生拒答训练、生成过程实时网络安全分类器、跨会话账户风险识别、差异化访问权限及持续监控执法,高风险输出会暂停并交由更强推理模型复核。OpenAI投入了超70万小时的等效A100 GPU算力,开展自动化红队测试,防范通用越狱攻击。#在海外对模型安全监管趋严背景下,#保障非恶性用途已成为前沿模型的必要合规项目。

模型定价比Anthropic更优惠

GPT-5.6 Sol/Terra/Luna的API定价为每百万Tokens输入/缓存命中/输出分别为5/0.5/30美元,2.5/0.25/15美元,1/0.1/6美元;相比Anthropic的Fable 5定价为输入/输出 10/1/50美元,Opus 4.8定价为5/0.5/25美元。