2个月前,大模型数学能力弱的问题广泛引起关注,市面上多款大模型甚至无法做对“9.11和9.9哪个大”的简单数学题。2个月后,业内正在逐步解决大模型数学能力限制的问题。
北京时间9月13日凌晨,OpenAI在没有预告的情况下发布了一个新的推理(reasoning)模型系列,包括o1-preview、o1和o1-mini三个型号。这便是OpenAI传闻已久的具有高级推理能力的“草莓项目”。据OpenAI介绍,新系列模型在数据和编码方面表现出色,在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%。
尝试突破数学能力限制的不只OpenAI。谷歌DeepMind团队此前也推出了Al系统AlphaProof,用于解决复杂的数学问题。