全文共2229字,预计学习时长7分钟
图源:unsplash
作为近年来的大热领域,数据科学是许多人正在付出巨大努力想要进入的行业。他们通过大学课堂,上网课或者自学来提升自己的相应技能。
但是,现实世界的数据科学不同于你在课程中学到的那些,有很多业务问题需要处理与解决,软技能对于成为一个数据科学家是同等重要的。本文中,笔者将分享一些作为一名数据科学家的个人经历。
懂得业务问题
现实社会中的很多难题是大学里不会遇到的。在学校里,学生常常是通过一个结构化的问题和一个常见的数据集,最终得到精确的答案。
然而,该行业的问题往往是非结构化且复杂的。对这个问题的任何假设在现实世界中都会适得其反。在深入分析之前,最好先完全了解业务问题。理解业务问题包括对问题及其领域进行更多的研究规划,向客户提出正确的问题并与团队成员进行讨论。
做好记录
数据科学和人工智能发展十分迅速,总有一些全新知识需要学习。想要记住所有的事情十分困难,做记录有助于克服这个难题。同时,做记录也帮助我明确了自己的思维过程。
过去,我常常记录自己的学习,分析过程、建模过程、实验过程和编码过程。我还会详细地记下了失败的实验和失败原因,从长远来看,这有助于提升自己的思维模式,它还提升了我的沟通能力以及对概念的详细理解。
你甚至可以记录一些小事,或者是你所学到或遇到的也许未来会有用的东西,用自己觉得方便的工具来记录下来就好。
团队合作
数据科学需要逻辑思维,在解决问题的同时还需要有更多的想法和创造力,因此,团队协作在数据科学中扮演着重要的角色,你需要从多角度思考问题而不是单一维度思考。
团队成员可能有着不同的文化背景,掌握的技能各有千秋,认清每个成员的强项并根据其强项分配工作,有助于用不同的方式解决问题并学习新东西。
图源:unsplash
成为好的倾听者
另一个关键点就是成为一个好的倾听者。数据科学是关于共享和协作的,人们需要理解团队中其他人的观点。很多时候,其他团队成员会提出很好的独特想法,为了在项目中成功地实施这些想法,你有必要倾听和理解它们。
正如我前面所说,数据科学不是一个人的单打独斗,它是团队协作的结果。
打造灵活的办公环境
灵活的工作环境让我在每个工作周期开始时都有明确的计划、优先级和方向,敏捷思维有助于应对变化和处理不确定性。如果遇到了不确定性,试着去选择,收集反馈,反复改进,这也给了我一个与不同团队合作的机会。
在每个工作周期结束时,以机器学习模型的形式向大家展示一个最小可行的产品(MVP),能够帮助我以更好的形式塑造项目。另外,每次工作周期结束后的反馈也能帮助我改正错误,高效地交付项目。
版本控制
版本控制在每个人的工作流中都是很重要的事情。它有助于集中管理代码,而不是保存到PC/笔记本电脑或外部驱动器中。这样一来,你就可以在任何位置执行新项目时参考代码或文档。
讲故事
讲好故事是数据科学的重要任务。我们正对数据进行处理,创建一个模型,并找到其中的奥秘。但从商业角度来说,这个模型说明了什么?这种模型是如何为公司赚钱或解决问题的?
利益相关者和管理层并不在意对p值或任何其他统计数据,你得以一种引人入胜的方式向非技术受众简单地解释模型。学会通过一则短篇故事来解释模型的方法,是我去年最大的收获之一。很好地具象化有助于以故事的形式传达信息,讲故事是一门艺术,需要时间和大量的练习。
创新输出形式
过去,我们总是使用传统的PPT向客户或利益相关者展示我们的工作,为什么不试着创建一个web应用程序或仪表板来解释我们的模型输出呢?创建一个web应用程序或仪表板显示了对项目的投入,同时也与利益相关者和客户建立了联系。
编程
在过去的8个月里,我的编程技能有了明显提高。我在工作和竞赛中学到了如何编写函数式或面向对象的代码,以获得最大的代码实用性。这不仅有助于在将来的项目中使用这些代码,还能减少当前项目所需时间。
每当我查找stackoverflow或google时,我都会记录代码函数,这有助于我学习编程方面的新知识,始终遵循着最佳方法并确保代码的易于阅读性。
不断学习
人工智能是IT行业的新热点,我们处在一个不断更新的行业中,所有这些知识都不可能在短时间内吸收。你需要决定采取战略性的策略,每天花一到两个小时学习新概念和解决新问题,包括学习新算法、编码、阅读博客、做个人项目等等。
此外,我强烈推荐阅读一些非技术性的书籍,这些书对操作流程和讲故事的技巧有很大帮助。
图源:unsplash
寻求帮助
数据科学是计算机科学、统计学、机器学习和领域专业知识的混合体,它需要具备从数据清理到解释最终模型和部署它的不同步骤等技能。
别害怕,你不可能在一天内掌握数据科学。如果你陷入困境,可以随时寻求帮助,这样你会获得更多的知识,最终对自己的方法充满信心。
富有激情
在最开始的时候,我的印象是:在这个数据科学世界里,每个人都是无所不能的。直到后来我才意识到这个刻板印象是错误的,这里的每个人都需要不断地学习。这个行业的核心是永远保持激情、好奇心和学习的渴望。无论是机器学习,还是深度学习,亦或是自然语言处理,解决复杂问题的热情总是要存在的。
拨开幻想的面纱之后,真实世界中的数据科学,依然充满了挑战与激情。
推荐阅读专题
留言点赞发个朋友圈
我们一起分享AI学习与发展的干货
编译组:骆昱含、高洋
相关链接:
https://www.kdnuggets.com/2020/06/exploring-real-world-data-science.html
如转载,请后台留言,遵守转载规范
推荐文章阅读
长按识别二维码可添加关注
读芯君爱你