大模型模型取得国际奥数竞赛金牌级成绩-（南京）软件科技有限公司

动态行业资讯

动态

大模型模型取得国际奥数竞赛金牌级成绩

发布时间：2025-07-24 08:00:50 阅读量: 341

【导语】近日，谷歌深度思维公司与美国OpenAI公司在国际数学奥林匹克竞赛（IMO）中取得重大突破，其AI模型首次荣获金牌级成绩。这一进展标志着AI系统在数(shù)学(xué)推(tuī)理(lǐ)能(néng)力(lì)上(shàng)的(de)显(xiǎn)著(zhe)提(tí)升(shēng)，引(yǐn)发(fā)学(xué)术(shù)界(jiè)广(guǎng)泛(fàn)关注(zhù)。两(liǎng)大(dà)团(tuán)队(duì)均(jūn)采用(yòng)自(zì)然(rán)语(yǔ)言(yán)处(chù)理(lǐ)技(jì)术(shù)，但(dàn)技(jì)术(shù)细(xì)节(jié)各(gè)有(yǒu)特(tè)色(sè)。尽(jǐn)管(guǎn)这(zhè)一(yī)成(chéng)就(jiù)令(lìng)人(rén)振(zhèn)奋(fèn)，但(dàn)专(zhuān)家(jiā)呼(hū)吁(xū)需(xū)有(yǒu)更(gèng)多(duō)可(kě)复(fù)现(xiàn)的研究数据来支撑相关结论。

大模型模型取得国际奥数竞赛金牌级成绩

据英国《新科学家》杂志网站22日报道，谷歌旗下深度思维公司和美国OpenAI公司相继宣称，其AI模型在近日举行的国际数学奥林匹克竞赛（IMO）中，首次取得金牌级成绩。

IMO一直被研究人员视为AI系统数学推理能力的试金石。去年，深度思维公司宣布，其开发的数学推理AI模型“阿尔法证明”和几何求解AI模型“阿尔法几何”携手取得银牌级成绩。

19日，OpenAI宣布其新型AI系统在4.5小时内正确解答6道国际奥数竞赛题中的5道；两(liǎng)天(tiān)后(hòu)，深(shēn)度(dù)思(sī)维(wéi)的(de)“双(shuāng)子(zi)座深度思考”系统交出了同样的成绩。IMO主席格雷戈尔·多利纳尔证实，成绩经由竞赛官方阅卷人严格评定。

与“阿尔法证明”和“阿尔法几何”系统都专为IMO打造，且使用名为“精益”的计算机编程语言编写问题和答案不同，今年两大团队的模型均采用自然语言处理技术。

“双子座深度思考”开发人员解释称，强化学习是机器学习的一个分支，旨在让智能体在环境中通过试错来学习如何实现特定目标。这种方法是谷歌此前在“阿尔法零”等AI游戏上取得成功的关键。

OpenAI则仅透露运用了强化学习与“实验性方法”，技术细节仍笼罩在迷雾中。

菲尔兹奖得主、美国加州大学洛杉矶分校数学家陶哲轩评价道，这一进展令人振奋，但需要可复现的研究数据支撑。IMO金牌得主约瑟夫·梅耶指出，自然语言证明虽具可读性优势，但冗长论证可能带来验证困难。

（原标题为《AI模型取得国际奥数竞赛金牌级成绩》）