重视国产线,双王+智谱,底部新增关注新国都~另外,Token一张图如上,国产份额持续提升

1、根据演示GLM-5.2 coding能力超预期,部分效果逼近Claude 4.8。

实测结果来看,GLM-5.2在简单任务和复杂全栈任务中均表现国产最强,优于Kimi K2.7 Code/Qwen 3.7 Max,与Claude 4.8/GPT 5.5的差距仅在于UI交互逻辑与前端审美。

2、复杂工程化能力较为突出,加入代码主动审查

智谱GLM-5.2与Claude 4.8的编码逻辑符合生产级规范,会先验证行情数据库接口可用性与规范后再开发,且开发完成后自主进行冒烟测试,无需人工介入测试,交付质量更稳定。但在Qwen 3.7 Max和Kimi K2.7 Code上均未观察到。

3、交付速度相对较慢,但长程复杂任务可一次性交付

长程复杂任务测试中,GLM-5.2 43分钟完成任务,耗时明显长于千问和Kimi,我们认为主要原因或是智谱算力不足。但GLM-5.2在长程复杂任务上倾向一次性交付完整结果,中途无需人工介入修复,而千问、Kimi等速度快的模型需要人工修正。对于工程化场景,与Claude 4.8的结果导向的模式一致。

天风计算机 缪欣君/刘鉴/李璞玉