当你听到 “数据科学家” 这个词时,这个词对你意味着什么?
正如《哈佛商业评论》所建议的那样,这是21世纪 “最性感的工作” 吗?它是否描述了一个拥有计算机科学,应用数学,统计学,经济学等高级学位的真正聪明的人?从大数据中分析和提取业务价值的人?
数据科学家可以是所有这些东西,还有更多。这种类型的专业人员使用各种工具,技术和批判性思维来寻找大型数据集中的模式和趋势,以得出以实际数据为中心的实际解决方案。
根据Hugo Bowne Andersenin HBR的说法,“数据科学家使用在线实验等方法来实现可持续增长。他们还清理、准备、验证结构化和非结构化数据,以构建机器学习管道,以及个性化数据产品,以更好地了解他们的业务和客户,并做出更好的决策。”
现在,即使你没有上过高级分析和数据科学的学校,理解数据科学家经历的思维过程可能会帮助你的早期创业公司理解这些专业人士到底在做什么:
任何数据科学项目都会对可交付成果,目标,结果,时间长度等有一系列期望。正如詹姆斯·勒 (James Le) 在 “如何在12个步骤中像数据科学家一样思考” 中指出的那样,更充分地理解一个人的期望的一种有用方法是提出好问题。
“好的问题在他们的假设中是具体的,好的答案是可以衡量的成功,而无需付出太多代价,” Le写道。在任何商业情况下,提高你的提问技巧都是有价值的。如果你正在变得更加数据驱动,它可能会帮助你的早期创业。Mark Schindler在TowardsDataScience.com上讨论了 “创建问题景观” 如何有助于创建数据策略; 他建议将您的问题分为三类:
您现在可以回答什么问题?如果您对当前数据进行了一些挖掘,您可以回答什么问题?由于您还没有数据,您无法回答哪些问题?辛德勒提供了每个类别的问题示例:
“在过去的30天里,你有多少次下载?“ 可能属于第一类。”在过去的30天里,您最常使用的用户的年龄是多少?可能会落入第二个。“ 你的用户的顶部和底部四分位数的平均会话长度是多少?“可能会落入第三。这个有用的练习可以帮助您找出有关您的业务和您可以回答的数据的事情,并可能为您指明新问题或假设场景的方向 (adata路线图),这些问题或假设场景可能尚未被证明或知道您想进一步探索。
戴尔EMC大数据实践首席技术人员Bill Schmarzo创建了一份28页的白皮书,“像数据科学家一样思考” 工作簿。在其中,他深入研究了数据科学家的思想过程,即使用预测性和规范性分析来找到正确的答案,以便企业可以实现其目标。
我特别喜欢 “识别数据源” 一节,该节解释说,在八步工作簿练习中,读者会发现各种 “可能” 提供有关以下方面的价值的新数据源: 1) 有针对性的业务计划 (增加销售,收入,网站流量,转化等),以及: 2) 他或她希望回答的关键业务决策。白皮书说,可能的数据来源包括:
历史操作和交易系统数据 (ERp,财务,人力资源,供应链,销售人员自动化和市场营销,这些数据被捕获,但可能无法在易于访问的平台上获得。内部非结构化数据源,如电子邮件对话,消费者评论,临床研究,来自员工和客户互动的研究论文和笔记。外部数据源,包括社交媒体,新闻提要,天气,交通,经济学,研究论文,白皮书以及来自政府和大学机构的公共领域数据。(就像科学家工作簿一样思考)。在工作簿中,Chipotle是一个经常出现的例子。Chipotle的数据源可能包括: 交易点,市场篮子,产品主管,商店人口统计和竞争性商店销售,商店经理说明,员工人口统计,消费者评论,Yelp,Zillow/Realtor.com,Twitter/Facebook/Instagramand更多。
一旦您确定了各种数据源,下一步就是评估每个数据源在支持某些关键业务决策方面带来的业务价值。您可以设置一个电子表格,并在第一个垂直列中将数据源绘制为行标题,然后在第一行中将关键业务决策绘制为水平列标题。在Chipotle的例子中,一些商业决策是:
增加商店流量增加购物袋收入增加促销效果您可以通过输入与您的行业和初创企业相关的业务用例问题来自己进行此练习。
如果您是一家初创公司或企业,希望扩展到大数据和机器学习领域,以免落后于竞争对手,那么可能是时候聘请您的第一位数据科学家工程师了。招聘这个角色可能比软件开发人员更复杂。福布斯撰稿人Shourjya Sanyal最近在一篇题为 “如何雇佣你的第一位数据科学家” 的帖子中写道,这项任务更加复杂,因为:
很难为数据科学家的角色编写职位描述。大量的数据科学家可能愿意申请,但很少有人拥有所需的经验。很少有行业标准和基准可用。Shourjya提出了可能有助于面试过程的问题。例如,如果您正在构建数据产品或应用程序,那么直接从学术界和相关研究实验室雇用科学家可能不会为您提供 “软件工程经验以及一些管理经验”,以确定任务的优先级并推动您的业务价值。
当然,总是有Uber在Twitter上雇用数据科学aVp的例子。从不同来源抓取和准备数据以构建数据管道也可能有助于启动数据驱动产品。Shourjyao还提到询问候选人的投资组合,如果其中包括团队项目,则该候选人具体做了什么贡献。
总体而言,您需要定义公司对首次招聘的需求。Insightly的数据科学家萨拉·维拉 (Sara Vera) 在 “雇佣数据科学家的艺术” 中写道,“如果你想建立广告定位或推荐引擎,或者 [进行算法训练,然后,你会想要寻找一位拥有非常强大的数学和计算机科学背景的候选人。“
请记住,数据科学领域相对较新,通常被归类为不同但重叠的技能组合,例如数据挖掘,数据工程,数据准备,人工智能,机器学习,分析,大数据,统计甚至数据可视化。
例如,如果你需要一个数据科学家,他将向经理报告你的产品是如何运行的,或者用户增长是如何增加或下降的,那么找到一个擅长 “数据讲故事” 的人是有帮助的。福布斯撰稿人布伦特·杜克斯 (Brent Dukes) 将这种工作描述为 “一种结构化的方法,用于传达洞察力的数据,涉及三个关键要素的组合: 数据,视觉和正在发生的事情的总体叙述。”
而且,正如维拉 (Vera) 所写,这些类型的数据科学家可能来自 “社会科学学术背景,因为在医学领域,例如,社会学,经济学或地理学使他们已经习惯于使用其数据来做到这一点。”
一旦你对你的初创公司到底需要什么做了更多的研究,你就可以对你的第一个数据科学家招聘应该是谁做出更明智的招聘决定。您深入了解该专业人员的工程和计算机编程语言的优势-和劣势-可以帮助您建立招聘路线图,以发展整个数据科学团队。