性能基准测试

小黄:在基准测试中,GPT-5的表现如何?

DOORM:在多个基准测试中,GPT-5的性能远超o3和GPT-4o,创下了新的最高水平,特别是在数学和真实世界编码方面