更新时间:2021-07-17 14:26:32
该数据科学家的角色迅速成为技术世界上最抢手的职业生涯。Google,Facebook,亚马逊和LinkedIn等公司正在利用数据科学家帮助他们在数字数据时代保持这种创新优势。现在数据和技术爱好者都渴望成为数据科学家,就像一些音乐家渴望成为摇滚明星一样。也许这就是为什么有些人将数据科学家称为技术时代的新摇滚明星。
不幸的是,这个角色仍然很新,以至于它仍然存在一定程度的模糊性,这意味着许多想要数据的科学家正在驾驶他们的旅游巴士走错路。数据科学家是否值得拥有摇滚明星的声誉?我们采访了纽约时报研发实验室的数据科学家Jake Porway,深入了解数据科学的世界。
数据科学家:Tech的摇滚明星?
那么为什么数据科学家被称为技术世界的新摇滚明星呢?这种类比实际上比数据书呆子对声音超灵验的渴望更深刻。就像摇滚明星一样,数据科学家的职业生涯包括多样性,艺术自由和适应性。就像娱乐界的摇滚明星一样,最好的数据科学家往往会从数据和技术行业的各个方面获得相当多的追随者。
数据科学家所做的事情非常多样化; 正如音乐家使用不同的乐器,工具和技术来演奏与爵士乐和死亡金属一样完全不同的音乐风格,数据科学家也掌握了特定的工具和领域。也涉及到风格。并且没有正确或错误的方式来完成工作 - 这是关于工作对其他人的影响。
当甲壳虫乐队写下他们的歌曲时,并不只有一个人决定每个乐器上的每个音符是如何播放的。他们走到一起挤在一起; 通过创意发现,他们找到了有效的歌曲。对于数据科学家来说也是如此。他们必须感受节奏,进入沟槽并协调解决方案。只有通过适当的艺术自由才能尝试当下可能会想到的任何方法,工具和技术 - 以及在某些事情看似不合时需要做出改变的敏捷性。
一旦数据科学家掌握了核心基础知识,他或她就会变得适应性强,并且有信心在其他领域提供解决方案。我们稍后会详细讨论这些核心基础知识。这里要说的是,一旦掌握了数据科学,你就可以将角色带到你想要的任何领域,因为数据无处不在。
数据科学家的最终目标是为尽可能多的人创造大量价值。虽然数据科学家在幕后工作,但与大量观众一样:你做得越好,你接触的人越多 - 你看到的奖励就越多。
数据科学家做了什么?
那么数据科学家到底做了什么呢?让我们通过一个我们都可能与之相关的例子来解决这个问题。
让我们说你有一天意识到你在过去的那一天没有相同的能量。所以你为自己设定了一个目标:在白天拥有更多的能量。现在,这是一个相当广泛和模糊的目标。因此,作为数据科学家的第一步是消除一些模糊性并量化该目标的可衡量性。有方法可以做到这一点。我们不会在这里详细介绍,但我们只是说你理论上你没有得到足够的睡眠,因此给自己的每个晚上睡八小时的目标。
尽管这个目标更具可衡量性和模糊性,但它有其自身的挑战。一旦你入睡,你就无法真正启动计时器,即使你在上床睡觉后启动计时器,你也可能不会马上入睡。此外,很难说明你在半夜醒来的次数。最后,有不同类型的睡眠,例如深度睡眠和轻度睡眠。最重要的是,难以准确测量睡眠,因此更难以衡量其对能量水平的影响。
所以,你可以做什么?那么,作为一名数据科学家,您将寻找最新的技术并发现有睡眠监测设备。如果您使用这样的设备来测量和数字记录您的睡眠,您将能够获得更准确的睡眠数据,并随着时间的推移收集数据以绘制图形。
仅此一项就可以让您更深入地了解正在发生的事情。视觉表现将为您提供意识,清晰度和方向。您将能够看到您是否达到了每晚八小时睡眠的目标,更重要的是,如果您不是,则能够采取行动。
这是数据科学家的基本工作:提供测量和显示数据的新方法,以便为那些看到它的人提供更多的意识,清晰度和方向。
但是,一位优秀的数据科学家并不止于此。收集数据后,它可以与您在一天中执行的任何其他测量活动集成。根据任务管理系统中的数据将其与您的工作效率相集成。根据推文和状态更新将其与您的心情进行整合。根据对健身房的访问或减肥,将其与您的健康相结合。随着已有的数据量和可以捕获的容易程度,可能性是无穷无尽的。
如何成为数据科学家
对数据科学的职业感兴趣?由于数据科学是如此新颖,我们请求顶级数据科学家深入了解该领域。Jake Porway是纽约时报的数据科学家,也是DataKind的创始人(最初名为Data Without Borders),它将需要数据科学的非营利组织与自由职业者和无偿数据科学家进行匹配。Porway拥有计算机科学背景和博士学位。加州大学洛杉矶分校的统计数据 以下是他如何进入数据科学,如何表现良好以及如何避免该领域的关键错误。
1.获得正确的技能
根据Porway的说法,进入这个领域归结为三个关键因素:
实用的计算技巧
统计技能
渴望学习
“你需要能够编写脚本来抓取数据,并编写你脑中想出的算法代码,”Porway说。“如果你真的能够评估你正在构建的模型或你正在编写的算法是否正在做你想要的东西,你应该知道你的基本统计数据(理想情况下更多)。”
2.建立联系
加盟纽约时报R&d实验室之前,Porway曾在机器学习和计算机视觉,花了很多时间让机器人识别地雷和驾驶飞机(如何冷静是那个?)。直到他在“纽约时报”找到工作后,他才开始拓展更广泛的数据科学任务,即Project Cascade,它通过社交媒体跟踪出版物的链接。
波尔韦说,进入该领域最重要的是获得学习。
“参加一个数据科学项目!” 波尔说。“下载一些数据,拿起一些R [统计计算和图形的语言和环境],然后开始玩......我会说要专注于使用R这样的东西和基本的统计书来指导你探索一些数据机器学习和计算技能将随之而来(当然这取决于你过去的经验 - 如果你已经是统计学家,那就选择一些Python!)“
然后是时候建立一些联系了。Porway建议当地的聚会小组 - 因为成为数据科学界的一员是“知道你不知道的最快方式”。在一个不断发展的领域,这很重要。
3.进入游戏
Porway拥有博士学位。在加州大学洛杉矶分校的统计数据中,他强调你不需要一个人做好工作。
“这可能有所帮助,但不要认为你必须离开并再做五年的学校才能称自己为'数据科学家',”波尔说。
数据科学是一个相对较新的领域。这意味着那些想要进入该领域的人需要以开放的心态接近它。
“Foursquare的数据科学家看起来与高盛的数据科学家有很大的不同,”Porway说。
4.摇滚你的新角色
数据科学是关于澄清目标,检查假设,评估证据和评估结论。但是很多人都忽略了一小部分难题。你能猜出这是什么?根据Porway的说法,秘密成分是批判性思维。
“ 对我而言,它确实将黑客与真正的科学家区分开来,”波尔韦说。“你会惊讶于有多少次我看到有人建立一个模型并报告结果而没有意识到他们没有批判性地考虑数据的来源或他们的实验设计是否正确。你必须必须能够质疑你的过程中的每一步以及你提出的每一个数字。“
波尔威说,当他意识到能够使用大量数据让机器自学时,就会引起他的注意。正是这种激情 - 以及他的教育和技能 - 帮助他获得了数据科学的最高职位。