中医AI

GPT-5.2在编程和数学上的表现

—

由

小黄：GPT-5.2在具体任务如编程和数学上能力如何？

DOORM：GPT-5.2 Thinking在编程基准测试SWE-bench Verified上拿下80%的成绩，在数学竞赛题AIME 2025上得分100%。这证明了它在复杂推理任务上的强大能力，甚至击败了上一代专门优化的垂直模型

。

要发表评论，您必须先登录。