当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 563支AI队伍做姜萍同份数学试卷: 结果最高分仅34分

6月13日,第六届阿里巴巴全球数学竞赛(简称“阿里数赛”)揭晓了决赛名单。江苏涟水中等专业学校17岁的学生姜萍以第12名的成绩,成为全球30名决赛选手中唯一的女性。
610E48D9C719D1FA3A59036F8EC30373011F78A6_size57_w1200_h800.jpg.webp

今年共有801名人类选手晋级决赛,他们来自全球17个国家和地区,平均年龄22岁,主要来自北大、清华、麻省理工、剑桥等知名高校。姜萍,这位来自江苏省涟水中等专业学校的女生,以93分的成绩在全球排名第12,成为首位进入阿里数赛决赛的中专在读生。她的专业是服装设计,但对数学充满热情,自学偏微分方程两年,预选赛期间几乎全心投入答题,以证明“女生学数学同样出色”。

连续数日的热搜让公众瞩目这位数学天才少女,同时也提升了阿里数赛的知名度。与往年不同,本届赛事首次引入了AI大模型挑战赛,吸引了全球563支来自顶尖高校和企业的队伍参与,他们与姜萍共同解答了同一份试卷。

4月13日,阿里数赛正式开考,数万名全球数学爱好者面临选择题、解答题和证明题的挑战。然而,6月13日公布的决赛名单中,801名晋级者中未见AI队伍的身影。

据官方统计,参赛AI队伍平均得分18分,与人类选手的平均水平相当。但AI最高得分仅为34分,远低于人类选手的最高分113分。

AI成绩不佳的主要原因在于基础模型的数学能力有限。尽管AI在解答题和证明题中可以通过知识检索获得基础分,但在深入分析时容易出现“知识幻觉”。特别是在选择题上,多数AI表现出“蒙题”现象。尽管如此,有案例显示,通过提示词工程可在一定程度上提升AI的数学能力。例如,有选手通过激励AI扮演数学竞赛大师,并承诺高额奖励,成功提高了20%的得分率。

阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示:“数学是智慧的皇冠,AI挑战赛是一项积极的尝试,有助于我们不断突破AI的能力上限。”


声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海