将业务问题转化为数据科学问题
已发表: 2018-07-03在许多数据科学面试中,通常会问与业务相关的问题。 受访者应在面试中解决企业面临的挑战。 例如,一家报业公司的利润正在下降,如何才能挽救局面。 Reliance Jio 如何决定从新位置开始运营是否有益。 Baba Ramdev SIM 的推出将如何影响 Reliance Jio 的业务等。
受访者通常会为数据科学问题做好充分准备。 他们期待并为诸如“如何估算缺失值”、“你如何决定哪种算法适合数据集”等问题做好准备。 然而,当他们面对商业案例时,候选人完全感到困惑。 部分原因是候选人不期望在面试中提出商业案例问题。 另一个原因是数据科学博客或课程都没有涉及如何将业务问题转换为数据科学问题。 有可用于数据分析的框架,但它们在如何将业务转换为数据问题方面却出奇地安静。 例如,CRISP-DM 框架在数据分析方面非常有名。 CRISP-DM 的第一步和第二步是“业务理解”和“数据理解”。 大多数有抱负的数据科学家不知道如何从第一步到第二步。 本文的目的就是填补这一空白。 Victor Cheng 的书和视频帮助我理解了如何将业务问题转化为数据问题。 这篇文章是基于他的教导。
目录
面试官心态
在深入探讨如何回答案例面试之前,让我们先了解一下面试官的心态。 面试官在问业务问题时在寻找什么? 面试官正在寻找的一些东西是:-
- 候选人是否具有独立思考的心态?
- 如果不准确,答案是否足够好?
- 候选人提供的解决方案是否对客户友好(如果是咨询公司)
- 候选人提供的解决方案是线性的吗?
- 候选人是否直观地解释了解决方案?
- 候选人的解决方案是否切实可行?
候选解决方案应该从挑战到解决方案以线性和逻辑的方式进行。 如果解决方案是分散的,随意地从一个点跳到另一个点,那么面试官的脑海中就会立即结束面试。 此外,与错误方法的正确答案相比,带有错误答案的正确方法更受欢迎。 如果方法是错误的并且答案是正确的,面试官会假设候选人很幸运。 并非在所有情况下都是如此。 如果该方法是正确的,那么它是可重复的,并且可以应用于许多业务情况。
什么是数据科学? 谁是数据科学家? 什么是分析?
回答“案例采访”问题
案例面试问题的答案可以分为三个阶段。 打开、分析和关闭。 打开和关闭是公式化的,可以通过练习轻松回答。 分析阶段因业务问题而异,涉及思维和创造力。 让我们看看在回答问题的每个阶段要做什么。
回答案例面试问题的步骤是:-
- 失速
- 验证您的理解
- 确定问题的结构
- 分析
- 关闭
失速(开幕阶段)
Victor Cheng 要求停顿五秒钟,然后说出类似“啊,这是一个非常有趣的问题”之类的话。 这被称为“失速”。 如果你等了超过五秒钟才回答,那么面试官会认为你不知道解决方案。 拖延有助于获得一些宝贵的时间来思考问题。
验证您的理解
通常“案例面试”问题是单行的。 将不会提供所有必需的信息来回答问题。 候选人应提出问题并验证他们的理解。 如前所述,如果是增加报纸利润的案例,那么你可能会问诸如“报纸涵盖哪些主题?”,“该报纸的目标受众是什么”等问题。澄清采访者使用的任何术语并且您不确定。 在这里重要的是你不要假设任何事情。 假设可能会导致解决公司没有面临的错误问题。 该练习还将告知面试官您在需要时寻求帮助的能力。
在回答的初始阶段,您可以自由地提出开放式问题。 随着时间的推移,你将失去自由,只能提出封闭式问题。 在最后提出开放式问题会导致面试官认为您正在尝试询问答案。 所以,不要犹豫,问一些你认为有价值的问题。
“如何成为一名数据科学家”回答!
识别结构
在提出问题后获得所需信息后,确定问题所属的结构。 Victor 指定了案例面试问题可以属于的四种不同框架。 框架的重要性顺序(根据采访中询问的频率)是:
- 利润
- 经营情况
- 并购
- 供应需求
业务状况框架的例子是——新产品的推出、对竞争对手行为的反应、需求的变化、公司的增长战略等。供应/需求问题的例子是建立新工厂或关闭工厂,通过收购、需求变化等来改变产能。
这些框架并不难。 利润问题最终可能以商业状况或供需问题告终。 尽管如此,这种分类将为我们的思维提供一个结构,并帮助我们应对眼前的挑战。
一旦确定了问题结构并将其与适当的框架相匹配,下一步就是描述框架的关键组件。 例如,如果增加报纸的利润,您可以谈论收入和成本。 小心,不要明确命名框架。 框架仅用于构建您的思维,而不是用于向面试官提及。 绘制框架的关键组件以及您的描述。 当您练习这些步骤时,它将成为您的第二天性。 识别结构的关键点是:

- 确定问题的性质
- 将问题与适当的框架相匹配
- 描述框架的关键组件
- 画
完成此操作后,继续进行分析问题的过程中的下一步。
前 17 名数据分析师面试问题和答案
分析
这里的分析并不意味着分析数据。 它仍然很远。 数据在最后。 在询问数据之前,还有其他事情需要解决。
通过询问从哪里开始来开始您的分析。 为了提高报纸的盈利能力,请问您是否应该考虑成本或收入。 根据面试官的选择继续你的回答。
将潜在问题可视化为决策树,然后从根开始。 陈述假设并根据面试官的选择选择一个分支。 识别并陈述分支机构中的关键问题。 提出标准问题并继续深入研究。 在这个过程中不断完善你的假设。 如果在没有任何解决方案的情况下到达分支的死胡同,则向上追踪到分支的节点并沿相反方向遍历。
在整个过程中大声思考。 这将帮助面试官了解你的思维和分析能力。 如果您的想法有任何缺陷,他们甚至可能会指出并帮助您朝着正确的方向前进。 大声思考案例面试问题始终是一个好习惯。
一旦你带着假设到达决策树的叶子,或者到达面试官不确定假设的地步,那么你可能会继续询问数据。 可以帮助接受或反驳您的假设的数据。 数据将有助于获得洞察力并做出业务决策。 需要记住的一点是,所有的数据请求都应该有可靠的解释支持。 在咨询的情况下,不加任何解释地索取数据不会得到采访者或客户的同意。
这样就完成了业务问题到数据分析问题的转换。 完成此操作后,您现在就知道如何继续分析数据了。 从这里开始,标准 CRISP-DM 步骤如下:
- 了解数据
- 建模数据
- 验证模型
- 模型部署
- 更新模型并保持相关性
回答案例面试问题的提示和技巧
- 细分您的数字
- 公司与竞争对手
- 当年与过去一年
- 大声思考
- 在索取数据之前解释为什么你需要数据
- 不要假设任何事情
- 练习回答业务问题
细分您的数字
数据科学就是将问题分解为其组成部分。 分析零件并得出见解。 将各个部分组合在一起,并提供由数据分析支持的建议。 这种部件的组合在咨询的语言中也被称为“综合”。
当数据被分割成多个部分时,可以获得更好的洞察力。 让我们假设报纸的利润由于收入损失而下降。 整体收入的损失并没有提供很多见解。 如果根据订阅者的年龄将此收入分成不同的类别,它可能会提供更有价值的见解。 公司可以针对特定年龄组执行一项行动以提高收入。 给定一个业务问题,始终了解如何最好地将其分解为不同的部分。
给定一个业务问题,想想它是仅由特定公司还是整个行业面临。 对于这两种情况,解决方案和建议将有所不同。 另一种思路是比较过去和现在的表现。 这两种思路都将为继续回答案例面试问题提供一个方向。
了解这些步骤和不同的框架只会让您达到一定程度。 帮助您成功回答案例面试问题的是“练习、练习和更多练习”。 这是没有其他方法的。 只有通过实践才能流畅地提出验证问题、识别结构、将问题与框架匹配、制定假设、遍历决策树等。 没有实践,不可能破解案例面试问题或将业务问题转换为数据分析问题。
数据科学家:神话与现实
总而言之,将业务问题转换为数据科学问题可以等同于案例面试问题。 为了成功地回答案例面试问题,需要遵循的步骤是——拖延面试官,确定问题的结构,将其与底层框架相匹配,制定假设,通过询问相关问题遍历决策树,最后通过以下方式询问数据解释你为什么想要它。 最后,要成功回答案例面试问题,练习它。 一旦您能够将业务问题转化为数据科学问题,请按照 CRISP-DM 框架分析结果并提供有数据支持的建议。
立即加入 IIM-Kozhikode 的商业决策数据科学专业证书课程!
可以使用数据科学解决业务问题吗?
答案是肯定的。 如今,大多数业务问题都可以使用数据科学和分析来解决。 数据科学使用 5 个步骤来处理和解决业务问题
1. 了解业务问题
2. 使用分析解决业务问题
3. 准备数据
4. 模型开发
5. 性能测试
数据科学和分析无法神奇地解决组织的所有问题。 这些是非常有用的工具,可以帮助公司做出准确的决策、自动化重复性工作和团队需要做出的选择。 公司可以使用数据科学方法来帮助他们的管理层做出更好的决策、预测未来的利润并开发更好的内容。
如何将业务问题转化为 AI 和数据科学解决方案?
要将业务挑战转化为 AI 和数据科学解决方案,数据科学家必须首先理解问题,以及数据分析的目标和 KPI,以及可用于解决问题的 AI 和数据科学方法. 数据科学家还应该了解组织期望从数据分析中获得什么以及计划如何使用结果。
如何应用数据科学解决实际业务问题?
如今,企业出于各种目的投资数据科学。 几乎所有不同的业务部门,如金融、营销、零售、制造等,都可以以不同的方式利用数据科学。 但每家公司使用数据科学的唯一目标就是解决业务问题。
数据科学家以不同的方式使用他们的技能来解决业务问题,例如
1. 创新——数据科学家开发新的方法来解决公司长期存在的业务问题,以前的方法无法解决。 简而言之,他们用新的解决方案替换旧的解决方案。
2. 持续改进——数据科学家对现有的数据科学项目进行持续改进,以使其更好地工作。
3.探索数据价值:当公司刚开始使用数据科学时,他们有很多数据以无组织的方式保存。 在这里,数据科学家通过从所有可用数据中提取有用的见解并探索潜在机会发挥着至关重要的作用。