揭秘IBM数据科学家面试：必备技能、面试流程、准备建议

作为一家以数据为中心的公司，IBM提供的服务包括软件解决方案、硬件架构（服务器和存储架构）、技术服务业务以及全球融资解决方案。IBM非常明白数据和数据分析的重要性，数据能在组织的每个层级中推动更好的商业决策。此外，作为分析和基于云的解决方案（Cloud-based solutions）的领先提供商，IBM提供了涵盖数据分析、存储、人工智能、物联网和区块链的全套基于云的产品和服务。如此一家“硬核”的咨询公司，它对数据人才的要求是怎么样的呢？今天我们就来深挖一下IBM数据科学家的岗位要求和求职准备！

IBM的数据科学家岗位

在任何企业数据分析团队中，数据科学家的作用范围大致包括：识别提供优化的机会，分析数据以识别趋势和模式，构建渠道和个性化的机器学习模型以了解客户的需求，以及做出更好的商业决策。

在IBM，“数据科学”的范畴涵盖了与数据科学相关的广泛工作（数据分析师，数据工程师，数据科学家和研究分析师），其职能包括从数据收集，组织和分析中发现见解，为信息基础架构，以及建立和优化数据模型。工作职能有时特定于所分配的团队和产品，有时更加专门化，例如针对内部和外部客户的IBM Analytics Consulting Service。

IBM的数据科学家被安排在IBM产品和服务的团队中，例如IBM Watson Studio，IBM Cloud Pak，IBMDb2，IBM SPSS，IBM Infosphere等。

岗位必备技能

IBM是一个以数据驱动的公司，非常重视数据科学。IBM的数据科学家岗位需要专业性，因此IBM一般情况下更喜欢聘用在数据分析、定量研究和机器学习应用方面至少具有3年（高级职位需要5年以上）行业经验的高素质人才。

对候选人的背景要求包括:

在统计，数学，计算机科学或其他任何与STEM相关的领域的理科学士/硕士/博士学位
具有统计计算机语言（R，Python，SQL等）的丰富经验，可以操纵数据并从大型数据集中获取见解
在创建和使用高级机器学习算法和统计数据方面具有丰富知识，例如回归，模拟，场景分析，建模，聚类，决策树，神经网络等
具有经典的机器学习和线性代数方法的经验，包括用于线性分类的支持向量机（SVM：Support Vector Machine）和用于减少数据维数的奇异值分解（SVD：Singular Value Decomposition）
拥有3年以上使用数据可视化和报告工具（如Excel，PowerBI，Tableau等）的经验
在使用分布式数据或计算工具（例如Hive，Spark，MySQL等）方面拥有丰富的行业经验
具有自然语言处理，文本分析，数据挖掘，文本处理或其他AI子域和技术方面的经验
对数据分析基础架构和数据工程流程（包括数据存储和检索，ETL，Docker，Kubernetes等）有充分的了解
软件工程实践的背景知识，例如版本控制，连续交付，单元测试，文档，发布管理

IBM的数据科学家团队

像许多大型科技公司一样，IBM有大量的产品和服务，并且有许多由高素质和专业的专业人员组成的部门和团队，致力于开发新产品和改进现有产品。

IBM的数据科学家有时团队合作，有时可能与内部其他团队进行跨职能合作。各个团队的具体功能可能有所不同，但是一般的数据科学家职能范围从轻量级数据分析到繁重的机器学习/深度学习。

以下列出了IBM的一些数据科学团队以及这些团队中特定的数据科学家岗位：

用户体验研究与分析

职能包括分析来自多个存储库的大型数据集，这些存储库包括基础研究，行为数据以及诸如AWS S3，Azure，MongoDB，SQL或NoSQL之类的数据库，以创建预测性和规范性模型，并提取可行的见解。职能还包括开发自动化报告和仪表板，以及与利益相关者（例如执行官，项目经理和设计团队）交流研究结果。

IBM全球技术服务（GTS）分析团队

该团队使用高级分析和机器学习模型来开发和构建创新的AIOPS解决方案，该模型可分析从各种IT运营工具和设备中收集的大数据，以实时自动发现和纠正问题。该团队中的数据科学家利用深度学习和LSTM模型自动实时检测任何异常并防止故障。

IBM Q Start团队

这里的数据科学家与研究和算法专家一起工作，以实现量子方法进行数据处理，运行数值和数据可视化。

软件开发&支持

该团队中的数据科学家负责扩展和优化数据模型、预测算法、关联算法、文本分析模型等等。如果你要加入这个团队，你还需要负责自然语言处理（NLP）项目，和使用自然语言分类以及RNN算法主导的项目。

IBM SME

该团队主要利用分析和深度学习模型，预测新兴趋势，并提出优化业务的建议。

IBM全球企业咨询服务部（GBS）

主要通过利用商业敏锐度及预测的机器学习模型，帮助IBM的客户做出更明智的商业决策。

IBM 客户创新中心（CIC）

在这个团队中的数据科学家，需要利用各种机器学习技术和高难度的统计学方法和概念，为业务提供可行的解决方案。例如,机器学习技术:集群，决策树，人工神经网络等等

面试流程

首先，你会从一个叫“HireVue”的在线编程挑战开始。然后，HR会根据你的简历，对你的项目经历等有个初步的电话面试。随后，是技术面试，在这一轮面试中，你会被问到各种编程问题，从基本的Python，到中级的Algo。最后一轮是到公司进行3轮面试（on-site）。

在线编程挑战

这是在HireVue平台上进行的5小时数据挑战。问题都是中等难度的，包括：行为、机器学习、统计等。应聘者需要一共回答13个问题，题型包括：视频应答、小作文、口头解释、和编程。

电话面试

这是由人力资源部门或者招聘经理进行的面试。主要围绕着你的简历和以前的工作经验进行，确保你符合岗位的基本要求。

技术面试

技术面试的问题就比较深入了。不仅会询问你做过的项目，还会问你“你都遇到了哪些挑战？”，“你是怎么克服的？”，“你使用了什么技术和方法？”，“你用了哪种机器学习算法？”等等。还会有很多关于编程和机器学习理论的问题。

on-site面试

IBM数据科学家最后一轮面试会有2到3轮，包括由高级数据科学家，经理，以及来自设计、统计、机器学习、管理层的IBM工作人员组成的一轮面试。

问题涵盖统计概念，机器学习概念和方法，大数据和框架以及情境行为问题。统计问题大部分是基于案例研究的。你还可能会遇到例如“你怎么解决数据科学问题？”，“描述以前使用过的项目/数据集”和“告诉我你的...经历”之类的问题。

整体大致为：

统计面试
机器学习/编程面试
行为面试

准备建议

IBM数据科学家面试既包括了数据科学概念的广度，也蕴含了深度。问题由如多元统计和机器学习算法之类的领域，也有像主成分分析、判别分析、线性和逻辑回归、k-means、分类和回归树、神经网络、预测性和规范性模型、多元回归和聚类分析等等。

建议你学完基础的统计和机器学习模型后，自己在白纸上练习编程，这样的练习有助于在on-site面试稳定发挥。

别忘了，IBM非常重视情景问题！所以你可能会遇到很多如“告诉我一次xxx的经历”，“你怎么解决xxx”，“描述一个你的某个项目xxxx”。这些问题是用来将你的个人经历和技术概念串联起来的。

IBM数据科学家面试问题

什么是深度学习？
什么是标准偏差？
你成为数据分析师的愿景是什么?
解释一下置信区间？
解释p值的重要性？
你熟悉哪些分析语言？（Python，Java等）
有监督与无监督机器学习有什么区别？
你有多少年的Python编程经验？
为什么要为IBM工作，你为什么认为你的背景很适合IBM？
p值是什么？
与分类预测模型相比，你如何评估回归预测模型的性能？
你如何处理缺失的数据？
用于评估预测模型准确度的矩阵是什么？
逻辑回归中的系数与比值比之间有什么关系？

如何验证机器学习模型？

以上就是“揭秘IBM数据科学家面试：必备技能、面试流程、准备建议”的详细内容，想要了解更多IT资讯欢迎持续关注编程学习网

扫码二维码 获取免费视频学习资料

Python编程学习

查看2022高级编程视频教程免费获取