GPT-5.2在编程和数学上的表现

小黄:GPT-5.2在具体任务如编程和数学上能力如何?

DOORM:GPT-5.2 Thinking在编程基准测试SWE-bench Verified上拿下80%的成绩,在数学竞赛题AIME 2025上得分100%。这证明了它在复杂推理任务上的强大能力,甚至击败了上一代专门优化的垂直模型