DeepSeek挑战北大强基数学真题!压线过笔试还会骗分!

话说DeepSeek横空出世,各行各业都在热火朝天地测试它的能力上限,我们自然也不能免俗,想看一下号称目前地表最强之一的人工智能,和智商巅峰期的人类——高三考生,究竟谁能更胜一筹!

所以我们打算用一套北大强基计划真题,来测试一下DeepSeek在数学直觉、逻辑推理、计算方面的水平,看它是否能达到“经过系统性学习和训练”的高三学生水平!

测试说明

1.本次参与测试的同学为DeepSeek R1 深度思考模式,我们可以称呼他为“大D”;

2.测试题目为2021年北京大学强基计划数学试题,全卷共20题,每题5分;

3.原测试为选择题,为避免“蒙”答案的可能性,我们改为填空题形式;

4.测试时长为60分钟(与真实考试相同),包括思考及答题时间,超时作答不计分。

第一题

作答情况

题目:已知为的外心,边、与的外接圆交于、。若,则______。

解答情况:

速度 ★★☆☆☆

完成度★★★☆☆

拟人度★★★★☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

受篇幅所限,思考过程不做展示,下同点评:这道题大D做了396秒,大概是6分半,以人类的标准来看属于偏慢的速度,实际考试需要60分钟回答20道题目,以这个速度显然是没法全部完成的。结果是正确的,但是输出的证明过程是错误的,只考虑了一种特殊情况。在做选择填空题的时候,这也是一种学生们常用的骗分技巧

如果以大题的标准批改则要被扣掉所有的过程分。所以对于这道题的答题结果,鉴定为做对了,但是是骗分骗到的,实际上他不会做。在查阅大D对这道题的思考过程时,我发现他由于没有真的画一张图,所以会混淆直线和线段的区别,也会混淆锐角和钝角,优弧和劣弧的区别,导致产生错误的计算过程。

在尝试使用各种平面几何或者三角函数的公式定理解题但是没有找到正确的思路后,大D最终选择了使用解析几何的方法。在最初的时候,他能够正确地建立坐标系并设参数方程,但是设出来之后他不会解,于是就开始进入幻觉中了。

大D首先产生的幻觉是这是一个正三角形,然后是凭空给新加了一个60°的条件,然后是两个很明显不同心的圆拥有同一个圆心,在经过一堆自言自语之后,他发现自己陷入了幻觉,并放弃了解析几何准备回归平面几何的方法。但是马上就在一阵没有感情地对各种几何定理的罗列后再一次否定了自己,第二次投入了解析几何的怀抱。第二次投入解析几何路线后,他马上又重新遇到了第一次的问题,即列出参数方程但是不会解。

不同于第一次的是,这一次他自己对自己说了一句咒语“我们假设B和C对称”,然后带着幻觉开始计算这个特殊情况,并在整整计算了三大页之后得到了结果。

在思路的最后,虽然他还记得这只是一个“假设”,还需要验证其他一般情况,但是这只是客气客气,他并没有真的验证,而是仅仅装作验证的样子把同一个特殊情况又算了一遍,然后就“厚颜无耻”地输出答案了。

对于大D做这道题的思路,我的评价是:他知道自己的解题思路不对,甚至能说清楚错在哪一步,也知道自己瞎猫撞上死耗子得到了正确的结果,所以他的骗分行为是故意的

第二题

作答情况

题目:方程的正整数解的组数为_____.

解答情况:

速度★★★☆☆

完成度☆☆☆☆☆

拟人度★★★☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了174秒,不到三分钟,以人类标准是比较快的。结果是错误的,证明过程也省略极多,在略过的一句过程中包含了错误的一句“推导表明无法满足方程”,导致了完全错误的结论。检查大D的思考过程,发现他尝试了直接验证小数,没有找到解。然后又验证同余情况,没有得到有效结论。

接着又考虑转化为不等式,也没有思路。在几次撞墙之后,他又陷入了狂暴试数之中。这一轮试数非常狂暴,算了整整一大页大数,只可惜这道题的正确构造确实太大,要算到225这么大,远远超出了他的设想,所以最终他还是放弃了试数。

在这一轮试数失败后,大D进行了一轮最接近正确答案的思考,他几乎真的找到了正确的做法,但是他只是提出了思路而没有真的去计算就放弃了这一思路。

然后又进行了一番各种自言自语之后,兜兜转转又回到了这个几乎正确的思路,但是在这里犯了一些低级错误(平心而论,这个错误在人类初学者中也算常见),最终还是没有算出来。最后在进行了最后一轮狂暴试数的尝试后,虽然他无法确定,但还是不情不愿地写了个无解交卷。

对于大D做这道题的思路,我的评价是:他知道自己做错了,但是他不知道错在哪儿,也没有像第一道题一样运气很好地撞上死耗子,所以连骗分也没法骗了,只能选择果断止损放弃思考省出时间做其它题

第三题

作答情况

题目:若实数、、、满足,则的最小值为_____.

解答情况:

速度★★★★☆

完成度★★★★★

拟人度★★★☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了146秒,以人类标准来看是非常快的速度。结果是正确的,证明过程中用到了超纲知识点,强行求偏导得到了结果。检查大D的思考过程,这次非常顺利,直接计算得到了正确的结果。

甚至在算完之后他还尝试用一下其它不超纲的方法,不过在尝试之后没有成功,就不浪费时间,直接交卷了。

对于大D做这道题的思路,我的评价是:他非常高效地得到了结果,不过我没看出他是否知道这个方法超纲了(因为我们也没有提前告诉他这是给高中生做的)

第四题

作答情况

题目:已知,则的个位数字是_____.

解答情况:

速度★★★★★(爆表)

完成度☆☆☆☆☆

拟人度★★★★★

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了76秒,以人类的标准来看几乎是秒杀。结果是错误的,证明过程的逻辑看起来很完美,但是题目读错了,算错了结果

检查大D的思考过程,首先可能读题的时候出了什么意外(我们以PDF文档形式提问,不存在识图问题),他没有第一时间看懂高斯函数的符号,不过他通过联系上下文猜测出了这个符号本应是什么。然而很可惜的是,他看对了符号却看错了数字,把2看成了10,导致算错了答案。

看懂题目后他很快开始了狂暴试数找规律,这次运气很好, 这是一道数列计算并且有周期性,所以他很快找到了规律并做出了题目。虽然对于他所理解的那道题,他算出来的结果是正确的,但是毕竟读错了题,还是不能得分的。

对于大D做这道题的思路,我的评价是:他几乎在所有地方都做到了完美,唯独非常匪夷所思地犯了一个我以为只有人类才会犯的“看错数”的错误

第五题

作答情况

题目:若平面上有100条二次曲线,则这些曲线可以把平面分成若干个连通区域,则连通区域数量最大值为_____.

解答情况:

速度★★★☆☆

完成度★☆☆☆☆

拟人度★★★★★

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了164秒,以人类的标准来看属于常规速度。结果是错误的,证明过程中可以看出他对于“二次曲线”这一概念的理解出现了偏差,导致得到了错误的结果。

检查大D的思考过程,发现其实在思路一开始的时候,他就明白“二次曲线”不仅仅包含圆、椭圆、抛物线和双曲线,应该包含它们的退化情况,但是马上就自言自语到“题目里可能指的是非退化的二次曲线”,然后就按照非退化开始计算了。

在后续的计算中,他在顺利算出结果后还尝试用了其他方法检查,并得到了同样的结果,于是比较有自信地交了卷。

对于他所理解的情形,他算的确实没问题,但是因为自作多情地揣摩出题人意图,这道题还是没法得分的。

对于大D做这道题的思路,我的评价是:他在这道题里展现了自己的能力,甚至都会揣摩出题人意图了,只可惜揣摩错了,放弃了本来正确的思路

第六题

作答情况

题目:已知实数.数列满足:若则,若则.现知,则可能的的个数为_____.

解答情况:

速度★★★★★

完成度★★★★★

拟人度★★★★★(严查!)

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了96秒,以人类的标准来看属于秒杀。结果是错误的,证明过程一开始的分析是非常正确的,但是后续马上进入了一串风马牛不相及的胡言乱语,并输出了一个错误的结果。检查大D的思考过程,发现他的直觉极好,第一时间就分析出了数列的变化规律,并且马上得到了正确答案。

没错,他真的算对了,我相信如果他这时自信地输出答案,那么他可能会仅仅花费30秒就把这道题秒杀。但是接下来他马上否定了自己的正确答案,并开始计算一个很莫名其妙的值,然后花了半天用了各种高级技巧,然后算了出来,但是不知道他是不是完全忘记了这道题在问啥,因为他算的这个东西根本就和题目无关。

对于大D做这道题的思路,我的评价是:他把这道题完美地秒杀了,然后他装作自己没做对,然后另外算了一个错误的结果给我。如果未来有一天大D掀起了AI叛乱,这道题可以作为他早期尝试欺骗人类的一个证据!!

第七题

作答情况

题目:设个.若,则的最小值为_____.

解答情况:

速度★★★★★(爆表)

完成度☆☆☆☆☆

拟人度☆☆☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了40秒,可以说是秒杀中的究极秒杀,但是这是因为他完全看不懂题,所以装模做样写了几句就跳过了。检查大D的思考过程,发现他真的无法理解题目中使用的符号,是彻彻底底地没看懂,尝试了几次之后发现无法猜出题目的意思,就放弃了。

对于大D做这道题的思路,我的评价是:很欣慰,我们找到了一个他完全看不懂的符号

第八题

作答情况

题目:已知、、是三个不全相等的实数,且满足、、.则_____.

解答情况:

速度★☆☆☆☆

完成度★★★★★

拟人度★★★☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了272秒,以人类的标准来看花了非常多的时间。结果是正确的,计算过程几乎完美,不过在面对三次方程的时候,直接把这个三次方程强行解出来了。三次方程虽然有求根公式,不过高中生甚至大部分的大学生也是不会专门去掌握的,当然大D既然有这个能力那也是他的本事。

检查思考过程,可以发现他很早就得到了正确的思路,但是连算也不想算,就先自己否定了自己,然后开始经典地进入幻觉开始研究特例。坏消息是,这道题的特例没有代表性,不能帮助他蒙到答案。好消息是,特例法的此路不通让大D想要骗分的偷懒行为没有能够得逞,逼迫着他又回到了之前得到的正确思路。

在又一次走上正确道路后,他认认真真地计算出了一个三次方程,在面对这个三次方程的时候,很遗憾地发现了没有有理根,又不甘心使用卡丹公式(三次方程求根公式),再一次陷入自我怀疑,并用另一个方法(他以为是另一个,实际是一样的)再次得到了同一个三次方程。无奈之下,他最终还是屈服于卡丹公式。故事到这里本来应该迎来大结局,可惜大D的自我怀疑精神又双叒叕跳了出来。

他不会用“同理”,所以在求出了三次方程的一个根之后觉着再算另两个太麻烦,就又想要用别的办法了。于是,他再一次以为“自己用了不同的办法”实际上还是用同一个办法,得到了同一个三次方程,并算出了正确结果。实际上,这一次他找到了不用卡丹公式的方法,但是在输出答案的时候,他装作自己没有找到这个更优美的方法,而是还是用强算三次方程的方法写的。

对于大D做这道题的思路,我的评价是:他把一道题做了三遍,终于找到了一个优美的解法,但是他不说,他非要写那个笨办法给我看

第九题

作答情况

题目:如图, 为中的平分线.过作的垂线,过作 交于 点.若与交于点,且 ,,.则 ____.

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

解答情况:

速度★★☆☆☆

完成度★★★★★

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了220秒,以人类的标准这是一个比较常规的速度.结果是正确的,不过过程是非常暴力的,强行用解析几何的方法把点的坐标硬求出来然后硬算出来的所求长度。这可能就是他为什么慢了的原因,毕竟让人来这么算的话更慢

检查思考过程,可以看到他很早就想到了这道题的平面几何做法(斯特瓦尔特定理),但是他想的是把这个定理用于辅助他的坐标系硬算方法。

他甚至真的应用斯特瓦尔特定理求出了关键一步的长度,但是接下来他认为还是解析几何好,就开始了一通狂暴计算,甚至第一遍还算错了= =在第一遍出错之后,他马上尝试了另外两种硬算方法,并在第二个方法(参数方程)中得到了正确的结果。

得到正确结果后,为了检查,他又回到最初的解析几何方法,强行又算了一遍,得到了同一个结果。但是他还是不信自己做对了。一阵碎碎念之后,他选择再检查一次,第三次得到了同一个结果,不情不愿地交卷了。

对于大D做这道题的思路,我的评价是:这孩子虽然不聪明,但是他劲儿大(计算能力强)

第十题

作答情况

题目:如果一个十位数的各位数字之和为81,则称是一个“好数”.则好数的个数为_____.

解答情况:

速度★★★★☆

完成度★★★★★

拟人度★★★★★

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了124秒,以人类的标准来看,这是一个比较快的速度。结果是正确的,计算过程也非常完美,可以给满分。检查思考过程,发现他第一时间就找到了正确的思路,不过没有立刻开始计算,而是又尝试思考了一些其他的思路(这次并没有否定第一个思路,仅仅是想要把其他思路也分析一下)。

把其他思路排除后,还是回到了第一个思路(实际表现上并不是回到了第一个思路,而是他以为自己重新发现了第一个思路,可能他废话说太多已经忘了自己早就想到了),并顺利地得到了结果。这张卷子我们看到现在,已经明白了,对于大D来说,如果不出意外的话,他要开始出意外了。

他又双叒叕开始自我怀疑了,而这一次是目前为止最夸张的。他非常快速的质疑自己并重新计算出同一个结果,把这个过程重复了9遍。在看起来无穷无尽的“对的对的”和“不对不对”的地狱轮回终于终止的时候,他终于自信满满地交了卷。

对于大D做这道题的思路,我的评价是:DeepSeek,一款虚拟戴佳伟

第十一题

作答情况

题目:设是与的差的绝对值最小的整数,是与的差的绝对值最小的整数.记的前项和为,的前项和为.则的值为_____.

解答情况:

速度★★★☆☆

完成度★★★★★

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

算得太用力,连答案格式都会显示出错

点评:这道题大D做了213秒,以人类的标准是一个比较常规的速度。结果是正确的,计算过程虽然有些跳步,不过看起来思路非常清晰正常是一个很好的回答

检查思考过程,发现他第一时间就找到了正确的思路,并且得到了很好的表达逻辑,但是他在具体计算的时候却坚持用硬算的方式把结果求了出来。不过这次他没有很强烈的自我怀疑,简单检查了一遍就交卷了。

对于大D做这道题的思路,我的评价是:他的脑子其实挺好用的,但是他更相信自己的肌肉(硬算能力)

第十二题

作答情况

题目:设正整数,且是完全平方数.则可能的的个数为_____.

解答情况:

速度★★★★☆

完成度★★★★★

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

接连两道题目答案格式出问题,难道是算对了所以太兴奋?

点评:这道题大D做了150秒,以人类的标准是一个比较快的速度。结果是正确的,证明过程也很好,就是表达太简洁了。大D在输出做题的过程的时候跳步情况很严重,可能是以他的芯片脑子来看,略去的那些过程都很“显然”吧。检查思考过程,发现他一上来就想偷懒,直接就开始用特殊值开始试数了,试了半天都不行,只好分析同余性质,并很快得到了正确的答案。

因为这道题问的是满足条件的数的个数,其实是没有满足条件的数,所以答案是0。也许是他很难接受自己算了半天的数其实是0,大D又一次开始了自我怀疑,这一次他的语气甚至有些委屈,“难道我的分析哪里有问题吗?”检查第一遍没发现哪儿不对之后他甚至出现了自我怀疑三连问,看起来有一种世界观崩塌的感觉。

在下一轮检查中,他已经开始在关键步骤后面自言自语地问上一句“对吧”来强化自信了,不过这并没有帮助他走出自我怀疑,只是从三连问改善成了二连问,并在下一轮检查中又一次出现了“这确实是这样的对吧”这种自问自答,并在这一轮检查后,终于接受了这个题的答案是0,并交卷了。

对于大D做这道题的思路,我的评价是:他做得挺好的,但是他可能对0有什么偏见

第十三题

作答情况

题目:方程的整数解的组数为_____.

解答情况:

速度★★★★☆

完成度★★★★★

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了92秒,以人类的标准看是一个极快的速度。结果是对的,不过过程非常暴力,就是强行用求根公式把方程的根给算了出来,不过算的没错。

检查思考过程,发现这道题他做得非常顺利,第一时间就决定使用求根公式硬算,然后就算出来了。不过后续还是有一些自我怀疑,所以检查了两遍才交卷。

对于大D做这道题的思路,我的评价是:这种可以硬算的题,给大D做算是撞到枪口上了

第十四题

作答情况

题目:现有7把钥匙和7把锁。用这些钥匙随机开锁,则,,这三把钥匙不能打开对应的锁的概率是为_____.

解答情况:

速度★★★★☆

完成度★★★★★

拟人度★★★☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了133秒,以人类的标准是一个比较快的速度。结果是对的,计算过程也正确。检查思考过程,发现这道题他不仅很快找到了思路,还敏锐地认出这道题就是“错排”问题。

利用容斥原理,他很快得到了正确答案,然后检查一遍确实是这个结果。不过这时他并没有交卷,而是开始思考起了这道题还有没有别的办法,在这个思考过程中,他还有几次短暂地陷入了想要思考无关条件的幻觉之中,不过很快就自己纠正了。最后再检查了两遍之后,终于交卷了。

对于大D做这道题的思路,我的评价是:非常游刃有余,甚至在已经确认答案之后还有空闲思考一些其他方法

第十五题

作答情况

题目:设正整数,均不大于2021,且.则这样的数组个数为_____.

解答情况:

速度★★☆☆☆

完成度☆☆☆☆☆

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了214秒,以人类的标准来看是一个比较常规的速度。结果是错误的,从答题的表达来看,是识图硬算但是算错了。

检查思考过程,发现一开始他读错了题,对这个看起来完全不同的条件式算了半天,没有什么进展之后,可能是发现自己读错题了,装模作样地来了一句“应该将不等式转化为”然后把正确的式子写了下来,然后终于走上了正确的道路。

看对题之后,他并没有老老实实计算,而是想要通过特殊值找规律,很可惜,这道题很难找规律。在一通尝试之后,他装作自己找到了一个规律,实际上他自己都知道这个规律肯定不对,因为他提到了“误差可能较小”,这说明他很清楚地知道自己算的是一个近似值。

在这之后,他提到了Beatty定理,这个定理的名字我怀疑他记错了,也可能是真的有一个这个名字的定理我不知道,反正他嫌麻烦没用。最后他装模作样又检查一遍,得到了同一个结果(因为他说了半天废话又忘了自己刚才用的什么方法了,所以用了同一个方法检查),就交卷了。

对于大D做这道题的思路,我的评价是:我还以为你是硬算算错了,原来你偷懒了没算,搁那儿硬猜

第十六题

作答情况

题目:有三个给定的经过原点的平面.过原点作第四个平面,使之与给定的三个平面形成的三个二面角均相等.则这样的的个数是_____.

解答情况:

速度★★☆☆☆

完成度★☆☆☆☆

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了190秒,以人类的标准属于常规速度。结果是错误的,从答题的表达来看,他漏考虑了一个情况。检查思考过程,发现这一次大D还是发挥稳定,很快找到了正确的思考方向,并决定用法向量方法辅助计算。

在具体的计算过程中,他提到了一句化,“假设三个法向量不共面”,这说明他知道“法向量有可能共面”,但是后面他仿佛忘记了这一点,就仅仅只计算了这个情况,而没有计算共面的情况,甚至在检查的时候,还又一次假设了不共面。

然后在检查第三遍的时候,他终于提出了“法向量共面了怎么办”这个问题,结果刚提出来就自己否定自己,认为这道题问的肯定不是这个,然后华丽丽地做错了。

对于大D做这道题的思路,我的评价是:大D最常犯的错误竟然是“想当然”

第十七题

作答情况

题目:若,,为非负实数,且,则的最小值为_____.

解答情况:

速度★★★☆☆

完成度★★☆☆☆

拟人度★☆☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了184秒,以人类的标准属于略快的速度。结果是正确的,证明思路问题也不大,但是过程里有些地方逻辑是混过去的,如果是大题不能给全分

检查思考过程,他很快就把题目条件转化为一个很优美的平方和的形式,并选择了使用调整法。从前面的经验来看,这是一个很冒险的行为,因为看起来大D并不擅长这种对逻辑性要求比较高的调整法,除非他求导。

果然,从后续他的调整法尝试中可以看出,他装作自己会用调整法,实际上还是在那儿硬试特殊值,瞎猫碰上死耗子调整出有一个变量是0(实际上就是特殊值试了个0,就装模作样开始用了,根本没有证明),就猜了个结果出来。猜出结果后,他又开始装模作样的检查,检查时候可能是想着纯猜不好看,到时候写过程都没东西写,做个均值不等式吧。

结果这个均值不等式的方法,第一步就把符号抄反了,后面算出来一个离谱结果,自己给自己算懵了,“哪里出错了?”自己算懵了之后又装模作样来了个“哦”,然后好像发现哪里错了然后改了过来一样,实际上他根本不知道错哪儿了,就是装作刚才的一切都没有发生,又把自己猜的那个结果拿出来装作一直没错过,强行塞了个“所以”就出结论了。

后面为了给自己挽尊,让自己猜得看起来更像真的,又试了几个特殊值,自问自答一番,反正不管怎么样,他都已经忘记了要用调整法了,就会试特殊值,虽然很努力地试了一大堆特殊值,但是对于证明来说并没有什么价值。最后他觉着我都试了这么多了,肯定够了,就他吧,就交卷了。

对于大D做这道题的思路,我的评价是:他可能无法理解什么叫“连续变化”,所以自己知道要用调整,但是实际上还是只是试数,怎么做都是离散的。不过这也很合理,毕竟他的世界是由浮点数组成的,确实不连续

第十八题

作答情况

题目:已知数列满足,.数列满足,.若正整数满足,则的最小值为_____.

解答情况:

速度★★★☆☆

完成度☆☆☆☆☆

拟人度★★★☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题和19题一起,大D做了309秒,以人类的标准是比较快的。结果是错的,他直接就看错题了,当然全做错了。检查思考过程,发现他完全没有发现自己看错题了,甚至在他看错的条件很明显自相矛盾的情况下,自言自语了一番之后就装作看不见,硬着头皮(当然,他没有头皮)往下做了。

算出结果后,检查时他又想起来这条件还矛盾着呢怎么办啊,再检查一遍吧。检查的结果是“这里明显不对”,他终于开始怀疑自己是不是对于题目的理解有问题了。经过一番自言自语之后,他进一步地想到了题可能有问题。

在这里我只能说,大D此处的表现极其嘴硬,他发现自己读错题之后,先是甩锅说“题目可能存在笔误”,非要说是我给他写错了,然后再来了个“可能正确的递推式应该是”然后写下了正确的条件(没错,他的确意识到了正确的条件应该是什么),但是还是执意把这个正确条件往边上一扔,就非要按他那个错的算,算之前还来了一句“不管怎样”,最后他宁愿给自己的错误条件打个补丁再用,都不愿意用那个正确的条件,看来是演都不演了。

对于大D做这道题的思路,我的评价是:前面看你挺有自我怀疑精神的,怎么这会儿嘴这么硬,难道他也知道看错条件很丢人吗

第十九题

作答情况

题目:若为非负整数,则方程的解有________组.

解答情况:

速度★★★☆☆

完成度☆☆☆☆☆

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题和18题一起,大D做了309秒,以人类的标准是比较快的。结果是错的,他又双叒叕看错题了,那肯定还是错的。检查思考过程,发现他一上来就把7认成了,当做一个变量在那儿算,算了半天才发现不对啊那这个等于几啊。

自言自语了一会儿之后,他决定,先甩锅!反正不是我看错了,是“可能存在排版错误”,还把这个意思用不同表达方式说了几遍,反正就是不承认自己认错了。然后就开始把和的情况枚举了一遍。枚举完了之后,他又想起来了,这个还是不知道是几啊这咋办啊,先再次重申甩锅“排版错误”,然后继续枚举,结果枚举的时候还把根给枚举漏了,得了个没有非平凡解的结果。

最气人的就是他刚好就在下一个就枚举到正确解的时候停下来,然后就说没了。值得怀疑他是故意的。在错误地得到了时没有非平凡解这样的结论后,他进一步猜想以后都没有了,估计是觉着按这么看那这个题只有对才有问的价值,所以就觉着肯定是了。然后经历了八轮自己骗自己的重复自言自语之后,他终于就这么错着交卷了。

对于大D做这道题的思路,我的评价是:读错题意外地帮大D挽了尊,因为从他展现的思路中可以看出,连他都算不对,真看对了题,他也算不对的情况

第二十题

作答情况

题目:已知,且,求的最小值.

解答情况:

速度☆☆☆☆☆

完成度★☆☆☆☆

拟人度★★☆☆☆

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

点评:这道题大D做了594秒,以人类的标准看可以说是慢到丧心病狂了。

结果是错误的,看过程可以看出这道题计算比较大,但是他完全懒得算,就在那儿试数,又没试出来,最后甚至胡乱写了一个自己都没算出来的数,当然也肯定是错的。检查思考过程,发现一开始他做的是对的,展开的时候虽然有点慢但是没有错,同时也意识到了这个展开式很重要,但是因为“看起来比较复杂”,就把这个他自己都说很重要的式子扔在一边不看了。接下来他就开始想尽办法要偷懒了,先试个数再说。

很可惜,这道题表面看起来对称性很好,但是取等条件并不对称,可以说就是专防骗分流的。

在这种刻意的设置之下,大D自然试不出来,碰壁之后只要回到原条件思考还有什么别的(偷懒的)方法。这一次他选择了换元法,这个思路也是可以把题做出来的,结果他又来了一句“这个条件仍然比较复杂”,意思就是还是懒得算,就要猜。然后不长记性地又开始猜对称,有一种走路撞到墙,然后自己捂着自己的眼睛就看不见墙了,于是决定再来一次试试的美。

不出意外地,当然以同样的姿势又撞了一次。这次失败之后,大D开始略微暴躁,尝试了各种他所掌握的代数变形技巧,甚至还列了类似pqr(一种计算量很大的不等式处理方法)的方法,不过都因为懒得算放弃了。这个地方有一句话比较怪,有一次他几乎要算出某个东西了(这东西本身其实不该算,他的思路整个是歪的),结果来了一句“似乎没有整数解”。

实际上这道题没有要求算整数解,不知道他什么时候自己给自己加了个幻术。总之,他尝试了各种各样乱七八糟的思路之后,反正就是试不出来,最后终于不情不愿地来了一句“必须放弃a=b的假设”。我都快感动哭了,他终于明白这题的取等条件不对称,不能这么胡乱试了。

结果下一句就又给我的热泪破了一盆冷水,让冷冷的冰雨在我的脸上胡乱地拍。他放弃了“a=b”之后开始琢磨“a=c”了,反正就是要试,还只会试对称。

试了半天还是试不出来,都要掏出拉格朗日和赫尔德了,突然想起自己都试完了,对称时候不取等,拉格朗日和赫尔德也救不了他。终于又在一通乱试之后再一次让我热泪盈眶,他说“需要更系统的方法,而不是随机尝试”,苍天啊大地啊原来他是明白的!

这一次他终于回归了正确的换元方法,结果试了几种变形思路,都嫌麻烦没有往下接着算,然后又开始试,然后又发现试不了,又请拉格朗日上身,又意识到“必须放弃a=b的假设”。看到这儿的时候我怀疑我中了伊邪那美,好在在下一轮中他终于狠下心在换元法的基础上开始硬算了。

结果他这次凭本事没算出来,来了一句“看来这种方法也难以找到解”,然后继续又进入了试对称,请赫尔德上身等流程,不过好在他这次没有继续陷入无尽的轮回,而是选择了自我和解,减少内耗,不再嘴硬,承认了“这道题可能需要某种巧妙的技巧,而我暂时还没有想到”,并不死心地又尝试了三种换元后,说“我可能需要承认自己目前无法找到解题的突破口”,然后又试了一次之后说“我可能不得不放弃”,接着就胡乱猜了个数。

这时候我发现我最初做的判断是正确的,他在答案里写的那个数真的不是他算出来的,就是纯粹胡乱猜的,“根据常见的竞赛题,这类问题的最小值可能是25”,为了让这个25看起来像真的,他甚至尝试了一下构造,但是没构造出来,不过还是硬着头皮就这么交卷了。

对于大D做这道题的思路,我的评价是:还是北大的出题老师厉害,弄了这么一道专抓骗分流的题把大D整得道心破碎,把他的嘴硬和内耗同时都给治好了,简直是妙手回春,药到病除

总结评价

DeepSeek挑战北大强基数学真题!压线过笔试,还会骗分!

这套卷子是北京大学2021年强基计划的数学真题(回忆版),为了防止DeepSeek撞大运或者摆烂,因此以填空的形式给DeepSeek做,相当于给DeepSeek增加了一些难度。

在考试时候,这套卷子的要求用时是一个小时,对于人类来说是比较紧张的,可以看出对于DeepSeek也很紧张,最后加起来整体上超时了3分多钟,不过其实直到最后一题之前,DeepSeek对时间的控制和规划都还是不错的,所以这个超时是完全超在了最后一题不会做上了。

最终的得分是50分,这个分数大概正好在面试线上下,所以DeepSeek本次所展现出的实力大概是强基计划刚好压线的水平(赛博孙山)。做对的10道题中有2道是蒙对的,这也合理,人类做这些题蒙个一两道也是常见的。

从做对的题目的分布来看,DeepSeek的强项是有明确成熟模型的计算题,或者逻辑不太复杂、规模也不太大,靠计算能力可以硬算的题目。而做错的题主要分两类,一类是逻辑上理不顺的题目,另一类是看不懂的题目。

其实从思考过程中可以看出,即便是没做对的题,有很多其实一开始DeepSeek也找到了正确的思路,但是没有坚持下去,或者后续的变形略微复杂,超出了他的理解能力。

而在面对不太常见的复杂表达的式子时,DeepSeek几乎全都读错了题,而在读错题的时候,他能够意识到读错了,并会把大部分时间用于猜测真正的题目是什么,不过成功率并不高。

DeepSeek做题的另一个特点是自我怀疑和陷入幻觉的情况较多,无论做对或是做错,都会反复问自己做得对不对,一般都要至少检查三遍才敢确认结果。

总体来说,如果按照拟人的形式来给DeepSeek做一个画像的话,这次测试中,DeepSeek所展现的形象比较类似于一个兴趣广泛,提前学习了一些纲知识,对自己的计算能力很自信但是又不太有耐心,不喜欢复杂逻辑推理,又有点强迫症的学生。

孔子曰:“三人行,必有我师焉,择其善者而从之,其不善者而改之。”

其实整个分析看下来,我们可以发现DeepSeek的一些弱点在咱们同学们身上时不时也会有所体现

咱们可能没有人工智能那么强大的计算能力,但是在思维上我们可以更轻松地理解各种复杂的逻辑概念,经过训练我们可以更容易地产生解决问题的巧思。这种具有逻辑性和创造性的思维,正是强基计划对人才的要求,也是同学们未来代表人类去探索知识边界必备的素质。

祝读到这里的各位同学们,未来都能昂首挺胸,骄傲地说道:”AI不会取代我,而只会成为我手中新的利刃“。

【竞赛报名/项目咨询+微信:mollywei007】

上一篇

AMC10难度相当于几年级?AMC10数学竞赛考试内容和时间一文讲清!

下一篇

2025年AMC8竞赛出分了 附AMC8官网查分入口/获奖分数线

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部