来自和鲸社区研究:头部数据科学人才24小时图鉴

http://www.edu.hc360.com2019年01月09日11:13 来源:互联网T|T

    【慧聪教育装备网】数据时代的到来,让数据科学红了一把。

    

    虽然是近几年才火起来的概念,但大家都挤破头想进入这个行业。《哈佛商业评论》更是宣称“数据科学家”是二十一世纪最性感的职业。

    

    数据科学这么红不是没有原因的,拿着令人艳羡的年薪,用手中的数据主导新产品甚至驱动公司的决策,而这个行业其实也在不断发展,相比几年前,数据人的工作方式和生活方式都得到了巨大的变革。

    

    那些头部数据人才,他们典型的24小时是怎样的?我们从刚刚升级的和鲸科技找到了答案。

    

    和鲸科技,前身为数据科学平台“科赛网(https://www.heywhale.com)”,于2019年元旦正式更名,旗下有聚集了超过50,000+数据智能人才的专业第三方数据科学社区kesci(科赛网),具备国际领先水平的数据分析及AI开发协作工具kescilab(简称“K-Lab”)。

1

    上班8小时:效率升级,“云端+协作”提升工作效果

    数据科学家主要的工作内容就是根据公司需求,从数据中攫取商业价值。而头部数据人才和普通数据科学家最大的区别就是:效率。公司支付的高薪酬也是在购买他们的高效率。

    云端工作

    不同于“数据科学家”这个职业刚刚出现的时代,从业者需要不断“迁就”手中的程序、甚至花很长时间学习功能。在数据科学高速发展的2019,他们需要更高的效率,提高效率的工具应运而生,这些工具需要不断预判和满足他们的需求。在线编程就是一个很重要的痛点,通过在线编程,不仅能免去繁琐的环境配置,还为提升工作效率加了一条助跑道:不用考虑电脑在不在身边、不用在乎文件有没有拷贝,所有资料都在云端同步,只需专注于手中的代码、数据、图表。

    但这并不好做,除了要直接在云端提供算力,在线编程工具还得保证环境统一,所以直到近几年才有相关产品诞生。

    

    K-Lab是一款在线协作工具,引入JupyterNotebook范式——这是专门为数据分析设计的工作环境,能够随时随地在云端开展数据处理、模型搭建、代码调试、撰写报告、团队协作等系列数据分析工作,数据科学家的工作将不再局限于本地环境,周末登山也能掏出手机训练模型、调整参数。

    团队协作

    与纯粹的程序员不同,数据科学家作为一个更偏商业应用的岗位,它需要和数据分析师团队,甚至是其他部门共同协作、指导公司的发展,也就更需要数据可视化和讲故事的能力。原因很简单,如果团队、客户甚至都听不懂你想做什么,即使你的代码、分析过程再优雅再准确,都只是白费力气。

    

    试想,当你向团队解释你的分析成果,他们更愿意看这一大段“不知所云”的代码,还是右边这张图呢?

           图源自和鲸科技-K-Lab

图源自和鲸科技-K-Lab

    K-Lab的协作功能同时考虑了两种场景:

    数据分析师团队交流时,常常需要互相修改源码,如果大家使用的计算环境、甚至编程语言都不同,效率未免也太低了。考虑到这种情况,K-Lab统一了计算环境,增加Fork、版本管理等功能,打开网页就能完成整个数据分析工作;

    如果你需要与非技术人员沟通,他们可不想看到密密麻麻的代码。在K-Lab中,不需要你重做一份PPT,只要一键隐藏代码,负责人便只看得到最后的图表、在线评论,同时“点赞+1”。这样,所有人能快速理解你的分析结果并且参与协作、提高生产效率。而且,界面清爽易读,把实时运行的代码、文本和可视化的图整合在一起,提升数据科学家讲故事、做决策的能力。

    

    目前清华大学、北京大学、中国人民大学、上海交通大学、浙江大学等知名院校已采用K-Lab进行数据科学与人工智能的教学与实训平台,也帮助了中国联通、中国平安、招商银行、腾讯、百度、携程、IBM、华为、南京市政府在内的一批顶尖客户解决行业问题。

    下班4小时:社交升级,社区生态加速学习

    据《2018数据人才白皮书》调查,数据科学人才平均每天学习时间大于4小时,而头部数据人才学习的时间则普遍更长,也许这是他们优秀的原因之一。

    

    但仅仅保证学习时间就够吗?技术飞速发展,人的升级跟得上摩尔定律吗?显然,学习方法和学习效率缺一不可。

    和鲸科技承办了多场数据竞赛,大赛结束后,都会对获奖者进行采访。从这些采访中,我们了解到,他们在课余时间/工作之余提升自己的办法十分类似——“在实践中学习”,几乎都是混论坛、看论文、打比赛。竞赛就是一种重要的实践方式,在竞赛中,他们能够直接接触到一线企业的场景和真实的行业数据。闷头做技术已经很难适应新时代,我们更需要通过与人交流共同升级。

    

    一般来说,初学者可以通过书本或课程学习新技术,三五年后就主要从做项目、看论文来提升自己了。而实践能够贯穿学习的全过程,数据竞赛平台就是源源不断的实践机会,从初学者到大神都能找到机会。数据科学家可以从中寻找合适的项目,如果获奖了一般还有几万元奖金。

           内容源自和鲸科技-科赛网(Kesci)-比赛

内容源自和鲸科技-科赛网(Kesci)-比赛

    

    要是心血来潮想研究某个问题呢?找到感兴趣的数据集,再开始自己的分析就好。

    

    内容源自和鲸科技-科赛(Kesci)-社区

内容源自和鲸科技-科赛(Kesci)-社区

    

    和鲸科技的社区就是一个给数据人成长、交流的生态系统,能够贯穿数据科学家成长的全过程:

    通过科小神训练营入门后,科赛社区的“项目”栏中提供了由浅到深的学习资料,用户可以直接下载数据集或者fork项目,等学到一定程度后,就可以在“比赛”中开始数据竞赛之路。每个环节都配备了相应社群,把与你等级类似的人链接在一起,你可以在社区、社群和大家一起打怪升级。

    

    从2015年搭建时,和鲸科技就开始聚集各大高校的数据科学人才,随后,从高校不断辐射到各大互联网企业、500强技术人才,现在已经有超过50,000+的数据智能人才在其中分享技术,沉淀了100+行业顶尖企业数据实操案例、6000+数据算法应用案例和5000G+优质数据集资源,数据集能够直接在K-Lab工作专区挂载,节省不必要的实践,专注于探索性数据分析,与社区的伙伴共同进步。

1

    数据人未来的工作方式

    上班8小时和下班4小时,工具和社区的升级,最终带来的是生活方式的变革。数据科学家并不是代码机器,他们不像人们的刻板印象那样:格子衬衫、黑框眼镜反着光,对着电脑敲代码。

    

    在数据人典型的一天中,提升工作效率、保证学习时间是很重要的一个因素,保持自我升级,是立于市场的不变法则。

1

    在和鲸科技的工具+社区+众包的生态中,数据科学家也得以摈除落后的工作方式,能够在社区内用在线编程、协同的方式,提升工作效率;能够面对市场团队、甚至甲方讲述自己的技术思考,甚至在闲暇时间内,在社区寻找项目给自己升升级;在线编程也让平板、手机编程成为可能,不用再为了一个Bug在周末跑回公司。

    

    你如何过一天,就如何过一生。和鲸生态带给数据科学家的,不仅是工作效率,更是数据人未来的工作方式。

    剩下的十二个小时你们会如何安排呢?快来和鲸社区跟我们分享吧。

责任编辑:贾巍

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。读者应详细了解所有相关投资风险,并请自行承担全部责任。

关于慧聪|网站导航|客服中心 |法律声明|广告服务 | 友情链接|移动站

客服咨询热线:400-6360-888 ( 免长途费 )  010-80707000工作时间:8:00 - 19:00

海淀公安局网络备案编号:11010802015485|京ICP证010051号

Copyright?2000-2018hc360.com.All Rights Reserved