DOORM
—
由
小黄:GPT-5.2在具体任务如编程和数学上能力如何?
DOORM:GPT-5.2 Thinking在编程基准测试SWE-bench Verified上拿下80%的成绩,在数学竞赛题AIME 2025上得分100%。这证明了它在复杂推理任务上的强大能力,甚至击败了上一代专门优化的垂直模型
要发表评论,您必须先登录。
发表回复
要发表评论,您必须先登录。