ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

ChatGPT自诞生以来已经火遍半边天,人们不断发掘它在各领域的应用。最近,机构的导师Tom Crawford在YouTube上分享了他用ChatGPT考牛津入学考试的实验,引发了大量数学爱好者的关注。今天,机构就带大家详解Tom老师的实验,试着用ChatGPT通过牛津大学入学考试!

导师介绍

Tom Crawford是牛津大学St Edmund Hall 数学系研究员,专攻应用数学,并在 Paul Linden 教授的指导下在剑桥大学完成了流体动力学博士学位,并于 2012 年获得牛津大学数学学士学位

除了教学工作外,Tom还与Teddy Hall的外展团队密切合作,定期在英国各地的学校和大学进行演讲。Tom同时也是一名摇滚爱好者,他的个人网站屡获殊荣,内含视频、播客、谜题和文章,旨在让所有人都能理解和理解数学。Tom还与 BBC 、YouTube 频道Numberphile 都有合作。Numberphile 是YouTube 上最大的数学频道,拥有过百万的订阅者。

用Chat GPT考牛津?

牛津大学数学入学考试简称MAT,这是所有牛津数学系申请者都需要参加的考试,通过考试方能申请牛津大学的本科数学课程。

MAT没有特定的及格分数,但是学生的得分在录取决策中具有非常重要的作用。MAT总共有5个大题,满分100分。第一部分是10道选择题,共计40分。接下来的四个大题每题15分。

Tom老师目前是牛津大学St Edmund Hall 招生团队的一员,他非常好奇像ChatGPT一样的人工智能对于MAT考试的应试能力。所以,他使用ChatGPT做了2021年牛津MAT真题

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

Chat GPT应试表现

01、第一题

第一道题是一道关于十二边形的几何题。Tom直接复制了题目,交给ChatGPT作答。

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

ChatGPT不仅给出了答案,并且分享了答题思路——

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

“为了找到正十二边形的面积,我们可以将它分成12个全等的等腰三角形。每个三角形的中心角等于30度开始,每个三角形的底边是十二边形的一侧是的,高度是从圆心到其中一侧的距离。为了找到每个三角形的高度,从中心圆到十二边形的其中一条边的中点画线,以十二边形一侧的一半和圆的半径形成一个直角三角形,我们发现每个三角形的高度是 1 的平方根减去二分之一,然后我们将其形成一个直角,面积达到三角形是四分之三的平方根,因此正十二边形的面积是三。”

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

可以看到,在评分守则的答案里,这道题的答案是(e)3。也就是说,ChatGPT得出了正确的答案。

但是,Tom老师指出了ChatGPT答题过程中存在的问题:假设底部三角形是直角三角形——“这是一个相当大的假设,你不能做出这样的假设。虽然它在这里说的是平均值。”这其中肯定涉及错误的高度。所以Tom老师表示:“我必须给第一个问题打零分,因为ChatGPT的答题过程存在错误。

02、第二题

第二题是关于积分的。由于不能直接复制题目给ChatGPT,Tom对于题目进行了拆解。

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

以下是ChatGPT对这道题的回答:

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

Tom检查了ChatGPT的答题过程,发现其中不止一个代数错误,而且有一些不通顺的答题逻辑。最后核对答案,很明显,ChatGPT错得有些离谱了。

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

“不幸的是,这又是一个零分回答。当然,这个问题是比较复杂的,ChatGPT在理解题意上可能也会存在问题。”

03、第三题

第三题的题目如下。

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

对于这一题,ChatGPT提供了严谨的解题方法,逐一验证了各个选项的答案,通过验证和排除终于选择出了正确答案。

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

“终于它得出了正确答案。我应该给它这道题的分数。”

接下来,Tom给ChatGPT逐一提供了2021年的MAT考题,并得出了属于ChatGPT的成绩单。在答题过程中,ChatGPT一度崩溃。“这在考试中不是很好——ChatGPT似乎坏了,就像在考试中崩溃的学生。”

ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)ChatGPT能通过牛津MAT吗?Blue百万网红导师亲身测试(附真题!)

ChatGPT的最终得分是48分。而MAT考生的平均分数是69.5分,所以,这并不是一个有竞争力的分数。

Tom最终评论说:“48分是个很糟糕的分数,我是很苛刻的。有一些题目的答题是很有趣的,但选择题的答题真的非常糟糕。总体来看,40分的选择题它只获得了12分。这可能是因为它对于题目和选项的理解有误。

所以,ChatGPT当然还有提升的空间。有时候,它已经接近了答案,但又很快偏离了。而且,无法输入图像可能也影响了它的答题正确率。”

总体来说,ChatGPT没有很好地通过牛津MAT,它的得分很低,正确率也不乐观。但无论如何,这是一个有趣的实验,我们看到了人工智能解决数学问题的潜力和发展空间。至少在现阶段而言,具备真才实学的同学们依然能在MAT考场上战胜人工智能!

【竞赛报名/项目咨询请加微信:mollywei007】

上一篇

哈佛大学为什么要“歧视”亚裔学生?

下一篇

被麻省理工点名推荐的iGEM大赛!生化专业申请的同学看过来!

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部