如果你问CS领域哪个竞赛最出名,大多数准留学生第一反应都是想到Kaggle。
Kaggle是全球顶级的权威性数据科学竞赛平台,也是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。它在2010年创立,专注于举办数据科学周边的线上竞赛。由于Kaggle竞赛题目有趣,不限年龄、背景和国籍,入门快且含金量高等优势,倍受准留学生们的热捧。
不过Kaggle虽好,但如果对它没有深入了解,很难在比赛中获得好名次!今天老师主要从以下3个常见问题,对Kaggle竞赛做一个详细介绍,希望可以给有需要的留学家庭带来参考。
1.Kaggle有哪些有趣的题目,它的含金量如何?
2.哪类学生适合参加Kaggle,如何进行备赛?
3.参加Kaggle的收获如何运用到申请中?
01、Kaggle有哪些有趣的题目它的含金量如何
Kaggle竞赛不止中学生可以参加,所有计算机爱好者,甚至计算机领域的从业人员都可以报名,再加上它需要你在提供的大型数据库里找到命题所需要的数据,还需要找到最合适的方式,将所需数据整编出来,想从中脱颖而出确实有一定难度。具体情况我们可以通过以下3个案例了解。
案例1
首先是一个相对简单的题目,关于著名的泰坦尼克号。它的命题框架是——在泰坦尼克号的历史背景中,船上共有2000名乘客,这些乘客的体质、背景和先天条件等都不尽相同,你要做的是通过提供的所有信息数据,来判断什么样的人更有可能在沉船事故中幸存。
这个题目需要参赛人把里面的重要因素挑选出来,并深入研究哪些因素会真正影响一个人的存活率,本质上是一个非常典型的统计学问题。
案例2
还有一个典型命题关于“买房”。我们在买房时会考虑很多不同因素,所以题目要求你通过VR或拍照等方式观测过去或现在市场上不同条件住房的出售情况,再根据给到的俄亥俄州一处居民住宅统计数据,预测这些住宅最后的成交量。
这个题目需要你通过经验去预测哪些因素会影响住房的成交及成交价格,同时通过匹配因素,比如某套房子与哪些房子类型相似,来预测这间房子的最终成交价格。这也是一个非常典型的统计学与CS匹配相结合的问题。
案例3
第3个题目案例的难度更大一些,关于Twitter、微博等社交媒体上用户有时会发布的报警求助信息。
社交媒体希望建立一个灾难预警识别系统,可以快速判断哪些信息是需要第一时间进行消息扩散救援的。但我们都知道社交媒体上每天用户发布的信息量非常大,所以这个题目的难度也具备很高的难度。
通过上述案例可以发现,Kaggle选定的命题大多是生活和工作中的实际问题,能够直接跟社会需要的技能衔接,发散性强,同时还综合体现学生的逻辑分析能力、编程能力和实践能力。因此它的含金量非常高,Top 30名校也对其非常认可。
02、哪类学生适合参加Kaggle如何进行备赛
从前面的内容不难看出,Kaggle适合有一定编程或微积分、线性代数基础,同时对现实问题有浓厚兴趣,并擅长运用所学知识去解决这些问题的学生。不过,由于Kaggle的获奖难度比较大,针对性的密集备赛还是很有必要的。
比如机构有一个在CS方面很有天赋的学生,他从9年级开始参加计算机奥林匹克竞赛,10年级时已经达到了铂金水平,但是Kaggle依旧没办法自己搞定。
所以如果想在Kaggle中表现好一些,少不了系统性的培训和老师的1V1指导,有需要的伙伴可以了解一下机构的Kaggle竞赛辅导项目。不过即便你在Kaggle里面没能拿到好的名次,它依旧对你的申请有很大帮助。
03、参加Kaggle的收获如何运用到申请中?
参加Kaggle的收获可以通过以下3种方式运用到申请中。
1、掌握的编程语言等技能可为其他活动打基础
前面我们提到参加Kaggle需要进行相关培训,具备一定的编程基础。从这一角度,备赛过程中学习的编程语言等基础技能,可以为未来参加其他CS相关科研和独立项目做准备。
2、产出可以当作作品展示在文书中
Kaggle与其他竞赛相比最大的亮点在于它兼顾了命题与创新发散,既提供了切入角度,又给了参赛人充分发挥的空间,进而从最大程度上保证了产出。因此,无论最终结果如何,你都解决了一个问题,而你解决这个问题的相关产出,可以当作品用来展示,也可以当作素材写进文书。
3、证明自身实力,为申请加分
由于Kaggle能够综合体现参赛人的能力,如果你做得足够好,把作品主页发给学校看,会成为申请时的超级加分项!重点来了!机构的Kaggle竞赛特训营怎么报名?我在这里能学到什么东西?锻炼什么样的技能?
Kaggle竞赛特训营
Featured项目:排名前15%
Getting Started项目:排名前3%
毕业于全美CS专业Top 1院校CMU CS专业的导师全程指导,20课时高强度系统专项训练,掌握比赛必备基础知识,并产出一份可证明实力的高质量机器学习科研报告!
导师介绍
K导师
卡内基梅隆大学计算机硕士
K导师清华大学计算机本科
曾在ICLR等AI顶级会议发表论文,研究领域包括机器学习,深度学习已经自然语言处理。曾就职于微软亚洲研究院,现在硅谷科技公司任职。曾在华尔街时报数据集的机器翻译Kaggle竞赛中,取得1/166的成绩。
W 导师
卡内基梅隆大学计算机硕士
中国科学技术大学信息与通信工程工学硕士
拥有丰富的科研辅导经验,曾在学生科研辅导培训中担任培训师,编写培训材料,带领学生进行科研选题、进度跟踪和论文撰写,涵盖“计算机图像处理”、“统计数据分析”、“机器学习”等多个方向,帮助30余名学生成功申请到USC、UCSD、Georgia TeTech等著名高校。研究成果也颇丰,已在多个顶级会议上发表论文,研究领域涉及自动驾驶、机器人、控制论、机器学习等。
课程内容
竞赛基础知识学习
1、比赛介绍与头脑风暴;
2、数据处理分析与案例研究;
3、机器学习基础知识与案例研究;
4、机器学习开发平台与竞赛教程和现场实践。
1V1参赛项目针对性指导
6-8次不限时深入沟通,针对性提升参赛能力与技巧。
课程亮点
1、14-16课时高强度专项训练,系统提高学生参赛能力;
2、测试课程学习成果,辅助学生匹配适合、擅长的参赛项目;
3、多轮1V1专项深入讨论、指导和答疑,针对性提升作品质量;
4、完成比赛的同时,完成一份可证明实力的高质量机器学习科研报告。