AAAI 2024竞赛：大模型数学推理突破创新

日期：2023-10-16 作者：itcg 浏览：610 我要评论

IT采购网10月12日消息，近日，国际先进AI协会(AAAI)宣布，由学而思领衔，与谷歌、暨南大学等多家科技企业和高校的专家学者合作，将联袂举办AAA2024全球大模型数学推理竞赛。

这项竞赛分为中文数学解题和英文数学解题两个方向，竞赛所需的中英文数据集TAL-SAQ7K-CN和TAL-SAQ6K-EN由学而思提供，据悉，这些数据集包含了来自国内外多个中小学数学竞赛的真题。

据IT采购网了解，这次竞赛将是全球首个数学大模型解题竞赛，主办方为参赛者提供了三个参考评估基准：GPT-3.5、GPT-4和好未来自研数学大模型MathGPT。

在竞赛期间，参赛者需要运用这些大模型来生成数学题目的推理步骤和答案。主办方将通过比较参赛模型生成的答案与正确答案之间的准确率来排名。主办方强调，他们期望参赛者使用大型语言模型来解决K-12(指学前教育至高中教育)的数学问题。

据介绍，目前大型语言模型存在一些“天生缺陷”，如缺乏复杂推理能力和数值计算的不准确性。如果这些模型能够克服这些问题，成功应对数学推理的挑战，那么AI领域将迎来一个全新的时代。

竞赛日程如下：

- 2023年10月10日：竞赛开始

- 2023年12月31日：最终提交截止日期

- 2024年1月10日：公布最终竞赛结果

奖项设置如下：

两个方向的前三名将获得现金奖励，一等奖1000美元，二等奖600美元，三等奖300美元。

此外，两个方向的前三名还将获得正式证书，并受邀在2024年AAAI国际大会期间发表口头报告。此次竞赛的前三名团队的第一作者还将被邀请撰写竞赛综述论文。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

西部数据推出 26TB 3.5 英寸硬盘，为创意专业人士和内容创作者增加容量	麒麟9006C：华为5纳米家族的新成员
中国大陆显示器线上市场：2023年11月销售火爆，创下新高	高通骁龙X Elite芯片挑战苹果M系列：硬件性能对决

相关资讯