OpenAI 發表 o3 推理模型,數學能力超越人類專家
OpenAI 宣布發表 o3 模型,這是其推理模型系列(o-series)的最新成員。o3 在多項高難度基準測試中展現出突破性的表現。
在美國數學奧林匹克(AIME 2024)測試中,o3 達到 96.7% 的準確率,而人類頂尖選手的平均成績約為 85%。在 ARC-AGI 測試——一個專為評估通用智能而設計的挑戰——o3 也達到了 87.5% 的成績。
OpenAI 執行長 Sam Altman 表示,o3 的計算成本仍偏高,目前正致力於降低推理成本,預計將於 2025 年初正式對外開放。

