大数据时代,数据科学也越来越引起人们的关注。但要注意的是,千万不要随这热潮去读。
专业介绍
随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。
一般来说,数据科学就是从数据中提取信息知识,即是数据挖掘与预测分析的延伸,亦是发掘知识与数据的过程。
数据科学是一门交叉的学科,涉及到很多的领域,包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。
其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。
课程设置
根据专业的开设情况,一般是开设在计算机相关院系下或者商学院下。
因此根据一些课程的整合,数据科学专业的课程大致分为以下三个方面:
模型,算法;数据结构;visualization(可视化)。
可以看出,以上这些课程都是与计算机密切相关的。所以整个学习过程,都需要一定的计算机技能,如编程、算法等。因此,如果申请者具有一定的数学、统计分析基础的话,更有利于获得申请成功。
就业方向
据相关数据报告显示,预计未来几年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到1500000!
数据科学专业就业领域广泛事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据科学的三类职业方向
(1)机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
(2)数据分析员 Data Analyst
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
(3)数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理,FB/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
院校推荐
哥伦比亚大学
Columbia University
学位项目:
Institute for Data Scienceand Engineering
-M.S. in Data Science
School of Professional Studies
-M.S. in Applied Analytics
哥伦比亚大学有一个世界顶尖的大数据科学与工程研究室(Institute for Data Sciences and Engineering),学生在此参与实验与科研项目。
斯坦福大学
Stanford University
学位项目:
-MSinStatisticsandData Science(School of Humanities and Sciences)
-MS in Computational and Mathematical Engineering (School of Engineering)
地点:斯坦福,加州
学制:1-2年
核心课程:数据库与信息系统应用;系统设计、构架和管理;数据挖掘与机器学习。
斯坦福大学的信息管理与分析分支涵盖了当今最前沿的数据库与信息 管理系统技术,并教授最先进的海量数据挖掘方法。
该项目的学生就业十分便利、抢手,比如每年都有大量学生进入亚马逊(Amazon)的EC2云计算平台处理大规模运算。
西北大学
Northwestern University
学位项目:
-分析科学硕士(Master of Science in Analytics)
-MS inMachine Learning and Data Science
所属学院:McCormick工程与应用科学学院McCormick School of Engineering andApplied Science
地点:伊凡斯顿(Evanston),伊利诺伊州
学制:15个月
本项目成立于2012年,融合了数学、统计、高端IT和数据分析的教学和研究内容,除了正常的授课外,学生还需要完成两个行业实习和一个课程设计。
加州大学伯克利分校
University of California, Berkeley
学位项目:
-数据科学工程硕士Master of Engineering (concentration in Data Science)
-信息与数据科学硕士Master of Information and Data Science (MIDS)
所属学院:工程学院和信息学院
地点:伯克利,加州
学制:12-20个月
伯克利的两个硕士项目综合教授技术和企业运营的技能,立足现有最前沿的技术,扎实务实地培养学生成为领域内的佼佼者。
卡耐基梅隆大学
Carnegie Mellon University
学位项目(更新于2023.12.21):
-MS in Data Anglytics for Science(Mellon College of Science)
-MS in Applied Data Science (Dietrich College of Humanities and Social Sciences)
-Master of Computational Data Science (School of Computer Science)
-MISM inBusinessIntelligence& Data Analytics (Heinz College of Information Systems and Public Policy)
地点:匹兹堡,宾夕法尼亚州
学制:16个月
http://www.heinz.cmu.edu/school-of-information-systems-and-management/information-systems-management-mism/business-intelligence-data-analytics/index.aspx
专业背景:Required: Statistics、Database、Object Oriented Programming;Suggested: Linear Algebra
卡内基梅隆大学的计算机科学专业排名在全美数一数二,与斯坦福、麻省理工起名,其数据分析与处理技术也名列前茅。