將業務問題轉化為數據科學問題

已發表: 2018-07-03

在許多數據科學面試中,通常會問與業務相關的問題。 受訪者應在面試中解決企業面臨的挑戰。 例如,一家報業公司的利潤正在下降,如何才能挽救局面。 Reliance Jio 如何決定從新位置開始運營是否有益。 Baba Ramdev SIM 的推出將如何影響 Reliance Jio 的業務等。

受訪者通常會為數據科學問題做好充分準備。 他們期待並為諸如“如何估算缺失值”、“你如何決定哪種算法適合數據集”等問題做好準備。 然而,當他們面對商業案例時,候選人完全感到困惑。 部分原因是候選人不期望在面試中提出商業案例問題。 另一個原因是數據科學博客或課程都沒有涉及如何將業務問題轉換為數據科學問題。 有可用於數據分析的框架,但它們在如何將業務轉換為數據問題方面卻出奇地安靜。 例如,CRISP-DM 框架在數據分析方面非常有名。 CRISP-DM 的第一步和第二步是“業務理解”和“數據理解”。 大多數有抱負的數據科學家不知道如何從第一步到第二步。 本文的目的就是填補這一空白。 Victor Cheng 的書和視頻幫助我理解瞭如何將業務問題轉化為數據問題。 這篇文章是基於他的教導。
業務問題到數據科學問題

目錄

面試官心態

在深入探討如何回答案例面試之前,讓我們先了解一下面試官的心態。 面試官在問業務問題時在尋找什麼? 面試官正在尋找的一些東西是:-

  • 候選人是否具有獨立思考的心態?
  • 如果不准確,答案是否足夠好?
  • 候選人提供的解決方案是否對客戶友好(如果是諮詢公司)
  • 候選人提供的解決方案是線性的嗎?
  • 候選人是否直觀地解釋了解決方案?
  • 候選人的解決方案是否切實可行?

候選解決方案應該從挑戰到解決方案以線性和邏輯的方式進行。 如果解決方案是分散的,隨意地從一個點跳到另一個點,那麼面試官的腦海中就會立即結束面試。 此外,與錯誤方法的正確答案相比,帶有錯誤答案的正確方法更受歡迎。 如果方法是錯誤的並且答案是正確的,面試官會假設候選人很幸運。 並非在所有情況下都是如此。 如果該方法是正確的,那麼它是可重複的,並且可以應用於許多業務情況。
什麼是數據科學? 誰是數據科學家? 什麼是分析?

回答“案例採訪”問題

案例面試問題的答案可以分為三個階段。 打開、分析和關閉。 打開和關閉是公式化的,可以通過練習輕鬆回答。 分析階段因業務問題而異,涉及思維和創造力。 讓我們看看在回答問題的每個階段要做什麼。
回答案例面試問題的步驟是:-

  • 失速
  • 驗證您的理解
  • 確定問題的結構
  • 分析
  • 關閉

失速(開幕階段)

Victor Cheng 要求停頓五秒鐘,然後說出類似“啊,這是一個非常有趣的問題”之類的話。 這被稱為“失速”。 如果你等了超過五秒鐘才回答,那麼面試官會認為你不知道解決方案。 拖延有助於獲得一些寶貴的時間來思考問題。

驗證您的理解

通常“案例面試”問題是單行的。 將不會提供所有必需的信息來回答問題。 候選人應提出問題並驗證他們的理解。 如前所述,如果是增加報紙利潤的案例,那麼你可能會問諸如“報紙涵蓋哪些主題?”,“該報紙的目標受眾是什麼”等問題。澄清採訪者使用的任何術語並且您不確定。 在這裡重要的是你不要假設任何事情。 假設可能會導致解決公司沒有面臨的錯誤問題。 該練習還將告知面試官您在需要時尋求幫助的能力。
在回答的初始階段,您可以自由地提出開放式問題。 隨著時間的推移,你將失去自由,只能提出封閉式問題。 在最後提出開放式問題會導致面試官認為您正在嘗試詢問答案。 所以,不要猶豫,問一些你認為有價值的問題。
“如何成為一名數據科學家”回答!

識別結構

在提出問題後獲得所需信息後,確定問題所屬的結構。 Victor 指定了案例面試問題可以屬於的四種不同框架。 框架的重要性順序(根據採訪中詢問的頻率)是:

  • 利潤
  • 經營情況
  • 併購
  • 供應需求

業務狀況框架的例子是——新產品的推出、對競爭對手行為的反應、需求的變化、公司的增長戰略等。供應/需求問題的例子是建立新工廠或關閉工廠,通過收購、需求變化等來改變產能。
這些框架並不難。 利潤問題最終可能以商業狀況或供需問題告終。 儘管如此,這種分類將為我們的思維提供一個結構,並幫助我們應對眼前的挑戰。
一旦確定了問題結構並將其與適當的框架相匹配,下一步就是描述框架的關鍵組件。 例如,如果增加報紙的利潤,您可以談論收入和成本。 小心,不要明確命名框架。 框架僅用於構建您的思維,而不是用於向面試官提及。 繪製框架的關鍵組件以及您的描述。 當您練習這些步驟時,它將成為您的第二天性。 識別結構的關鍵點是:

  • 確定問題的性質
  • 將問題與適當的框架相匹配
  • 描述框架的關鍵組件

完成此操作後,繼續進行分析問題的過程中的下一步。
前 17 名數據分析師面試問題和答案

分析

這裡的分析並不意味著分析數據。 它仍然很遠。 數據在最後。 在詢問數據之前,還有其他事情需要解決。
通過詢問從哪裡開始來開始您的分析。 為了提高報紙的盈利能力,請問您是否應該考慮成本或收入。 根據面試官的選擇繼續你的回答。
將潛在問題可視化為決策樹,然後從根開始。 陳述假設並根據面試官的選擇選擇一個分支。 識別並陳述分支機構中的關鍵問題。 提出標準問題並繼續深入研究。 在這個過程中不斷完善你的假設。 如果在沒有任何解決方案的情況下到達分支的死胡同,則向上追踪到分支的節點並沿相反方向遍歷。
在整個過程中大聲思考。 這將幫助面試官了解你的思維和分析能力。 如果您的想法有任何缺陷,他們甚至可能會指出並幫助您朝著正確的方向前進。 大聲思考案例面試問題始終是一個好習慣。
一旦你帶著假設到達決策樹的葉子,或者到達面試官不確定假設的地步,那麼你可能會繼續詢問數據。 可以幫助接受或反駁您的假設的數據。 數據將有助於獲得洞察力並做出業務決策。 需要記住的一點是,所有的數據請求都應該有可靠的解釋支持。 在諮詢的情況下,不加任何解釋地索取數據不會得到採訪者或客戶的同意。
這樣就完成了業務問題到數據分析問題的轉換。 完成此操作後,您現在就知道如何繼續分析數據了。 從這裡開始,標準 CRISP-DM 步驟如下:

  • 了解數據
  • 建模數據
  • 驗證模型
  • 模型部署
  • 更新模型並保持相關性

回答案例面試問題的提示和技巧

  • 細分您的數字
  • 公司與競爭對手
  • 當年與過去一年
  • 大聲思考
  • 在索取數據之前解釋為什麼你需要數據
  • 不要假設任何事情
  • 練習回答業務問題
如何在數據領域創造光明的職業

細分您的數字

數據科學就是將問題分解為其組成部分。 分析零件並得出見解。 將各個部分組合在一起,並提供由數據分析支持的建議。 這種部件的組合在諮詢的語言中也被稱為“綜合”。
當數據被分割成多個部分時,可以獲得更好的洞察力。 讓我們假設報紙的利潤由於收入損失而下降。 整體收入的損失並沒有提供很多見解。 如果根據訂閱者的年齡將此收入分成不同的類別,它可能會提供更有價值的見解。 公司可以針對特定年齡組執行一項行動以提高收入。 給定一個業務問題,始終了解如何最好地將其分解為不同的部分。
給定一個業務問題,想想它是僅由特定公司還是整個行業面臨。 對於這兩種情況,解決方案和建議將有所不同。 另一種思路是比較過去和現在的表現。 這兩種思路都將為繼續回答案例面試問題提供一個方向。
業務問題到數據科學問題
了解這些步驟和不同的框架只會讓您達到一定程度。 幫助您成功回答案例面試問題的是“練習、練習和更多練習”。 這是沒有其他方法的。 只有通過實踐才能流暢地提出驗證問題、識別結構、將問題與框架匹配、制定假設、遍歷決策樹等。 沒有實踐,不可能破解案例面試問題或將業務問題轉換為數據分析問題。
數據科學家:神話與現實

總而言之,將業務問題轉換為數據科學問題可以等同於案例面試問題。 為了成功地回答案例面試問題,需要遵循的步驟是——拖延面試官,確定問題的結構,將其與底層框架相匹配,制定假設,通過詢問相關問題遍歷決策樹,最後通過以下方式詢問數據解釋你為什麼想要它。 最後,要成功回答案例面試問題,練習它。 一旦您能夠將業務問題轉化為數據科學問題,請按照 CRISP-DM 框架分析結果並提供有數據支持的建議。

立即加入 IIM-Kozhikode 的商業決策數據科學專業證書課程!

可以使用數據科學解決業務問題嗎?

答案是肯定的。 如今,大多數業務問題都可以使用數據科學和分析來解決。 數據科學使用 5 個步驟來處理和解決業務問題

1. 了解業務問題
2. 使用分析解決業務問題
3. 準備數據
4. 模型開發
5. 性能測試

數據科學和分析無法神奇地解決組織的所有問題。 這些是非常有用的工具,可以幫助公司做出準確的決策、自動化重複性工作和團隊需要做出的選擇。 公司可以使用數據科學方法來幫助他們的管理層做出更好的決策、預測未來的利潤並開發更好的內容。

如何將業務問題轉化為 AI 和數據科學解決方案?

要將業務​​挑戰轉化為 AI 和數據科學解決方案,數據科學家必須首先理解問題,以及數據分析的目標和 KPI,以及可用於解決問題的 AI 和數據科學方法. 數據科學家還應該了解組織期望從數據分析中獲得什麼以及計劃如何使用結果。

如何應用數據科學解決實際業務問題?

如今,企業出於各種目的投資數據科學。 幾乎所有不同的業務部門,如金融、營銷、零售、製造等,都可以以不同的方式利用數據科學。 但每家公司使用數據科學的唯一目標就是解決業務問題。

數據科學家以不同的方式使用他們的技能來解決業務問題,例如

1. 創新——數據科學家開發新的方法來解決公司長期存在的業務問題,以前的方法無法解決。 簡而言之,他們用新的解決方案替換舊的解決方案。
2. 持續改進——數據科學家對現有的數據科學項目進行持續改進,以使其更好地工作。
3.探索數據價值:當公司剛開始使用數據科學時,他們有很多數據以無組織的方式保存。 在這裡,數據科學家通過從所有可用數據中提取有用的見解並探索潛在機會發揮著至關重要的作用。