数据世界正在迅速扩张,但是进入数据科学领域并不代表我们能够独自完成所有相关的工作,更重要的是:不同类型的工作角色有着不同的风格。是时候问问自己:"我适合哪种类型?"
未来期望从事哪个行业?
在现实世界里, ML(机器学习)/AI (人工智能)领域汇集了与数据相关的每一个工作角色,从统计学家到可靠性工程师都包含在内。但是,到底有多少种数据科学领域的工作角色?他们的工作内容和特征又是什么呢?就让我们来快速浏览一下数据科学领域中的常见角色吧!
本文用“厨房”作比喻来解释不同的数据科学工作角色。假设我们把某一个工作想象成在厨房会使用的词语:
-
【数据】 = 【成分】
-
【算法】 = 【设备】
-
【模型】 = 【配方】
-
【预测结果】 = 【菜品】
以下是常见的数据科学领域的工作:
数据工程
通常有两种形式:提供数据集供数据科学家使用,或者实现大规模数据交付。
当我们只是给自己做饭时,去超市购买食材只是一件简单的事情。但是当我们扩大规模时,即使是琐碎的事情也会变得复杂 —— 比如,要如何购买,储存和加工20吨冰淇淋而不让它融化呢?如此巨大的规模使这件事情变成一项复杂的挑战。同样,如果我们只是为学校的某个项目下载电子表格,做数据工程工作相当容易,但是当我们处理PB级(100万GB)的数据时,工作内容会非常繁杂。
数据科学研究
在“厨房”比喻中,这是“发明新型厨房电器”(设备)的工作。我们可以把这看作是数据科学的理论研究方面。重点是,需要创造新的理论来增强我们解决问题的能力。
这一类工作人员就像“发明家”——他们的工作重点是证明不可能的事情是可能的。他们享受这个过程和成果,并且随时准备好进行下一个挑战。在“厨房”比喻中,这一类工作属于设备类。虽然工作人员尝试着将想法变为现实,但是这个全新尝试出的设备并不完美。例如,当我们操作界面时会发现一点也不好用。用户友好?功能强大?精心设计?这可不是数据科学研究人员的工作。这一类工作人员只忙于弄清楚“如何将传输功能引入微波炉”也就是开发新的功能。
数据工具制造/平台工程
这一类工作是构建用户友好的设备,并将其整合到“厨房”中。这是为了向数据科学家提供可使用的工具和平台。
平台工程师不会发明新的设备,而是调试新设备或者新版本让用户接受度变得更高。他们拥有出类拔萃的设计思维,高可靠性和高效率。例如,他们会做用户研究,以确保用户喜欢他们的产品,所以在“微波炉“的起步阶段,他们不会在商店销售大量的新手不友好版本。回到现实,人工智能领域中真正困难的部分并不是思想上的,而是制造上的——与平台工程师的工作息息相关。
决策智能
这一类工作负责在“配方”和“菜品”方面进行创新。我们可以把它看作是数据科学的应用方面。它能够利用数据和算法解决特定的业务问题。
决策智能团队成员致力于配方创新。对现有算法不满意?他们选择招揽一名算法研究人员;需要好用的工具?他们会让一名平台工程师加入团队。他们对“烹饪”更感兴趣,而不是指特定的某一种“烹饪”手法。他们对不同产品发明不同的“定制配方”来解决不可能的商业问题。因为“厨房”的“设备”和“成分”原料非常之多,他们能够帮助我们弄清楚如何做出米其林星级的零卡披萨。
应用 ML/AI 的项目阶段
在应用ML / AI领域,你需要弄清楚你在哪个项目阶段工作,并找到对应的角色。
以下是常见的三个阶段:
推进阶段:进入“厨房”之前,思考我们的目标是什么?如果我们想要某个全新的设备,那就召集团队一起创造出来。
样本阶段:假设我们的目标是制作一种纯素的零卡路里香肠,味道和肉肠一样。那就让“厨房”忙起来,不停地尝试和改进吧!
生产阶段:终于琢磨出了一个不错的配方,在“厨房”生产看看效果如何。
推进阶段中的角色
决策者/产品经理:负责想出方案为客户提供服务并且细化到进行服务的方式。
数据工程师/架构师:“设备”已经完成了,他们负责找到能够大规模储存和管理“成分”的物流方法。
研究员:研究现状并告诉团队成员还需要发明什么东西。
工具/平台制造工程师:制造出一个顾客喜欢使用的产品。此类型包含传统软件团队中的所有角色,从设计师到软件工程师。
最后三个角色可以外包——例如云提供商,可以帮助处理“厨房”设置或“运输”等事情。
最重要的是:确保你确切地知道自己在销售什么产品:数据?算法?让其他人制作AI的工具?使用 AI 的解决方案?最重要的是专注于你的核心业务。
样本阶段中的角色
分析员:分析员是唯一一个能够仔细观察所有事情的人。在“厨房”比喻中商店和厨房都是黑暗的,只有分析员拥有手电筒。
数据工程师:找到一个办法既可以拿出2万吨冷冻胡萝卜又可以保证拿出来时仍然是冷冻状态。
ML / AI工程师:在“厨房”里不断尝试,直到我们真的做出了零卡的素食香肠。
统计学家:确认所使用的“配方”足够好,可以满足用户要求。
生产阶段中的角色
ML / AI工程师:团队有一个很棒的“样本配方”。我们需要做的就是不断调整让它变得更好,并随时进行维护。
可靠性工程师:安排生产和建立“安全网”,保证我们按照“配方”工作不会出现错误。
分析师:监控生产,在出现问题时发出警报。
统计学家:进行实时实验以验证用户是否满意,还要观察配方是否满足不断变化的要求。
所有项目阶段的角色
决策者/产品经理:团队的领导,负责指导大家!
定性专家/决策科学家/数据翻译:如果决策者对“食物”一点也不了解,他们负责回答一切关于“食物”的问题。
顾问/专家:决策者寻求指定建议(如用户体验)的人。
技术人员:帮助完成工作的人,尽管这一职位的工作基础且繁多。但是所有“厨房”团队都非常需要他们!
传统软件项目中的所有标准角色(从开发人员到项目经理再到人员经理)都在 ML/AI 厨房中占有一席之地。
以上就是“ 只知道DA/DS?说明你完全不了解数据岗位!”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/10224/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料