掌握數據科學的主要步驟,相信我,我已經嘗試過了

已發表: 2017-10-10

Thulasiram 從 UpGrad 和 IIIT-Bangalore 獲得了數據分析的 PG 文憑,現在在 UpGrad 工作,擔任 UpGrad 的數據分析項目助理
多年前,我在《賣掉法拉利的和尚》一書中讀到一個故事,這個故事我至今記憶猶新。
從前有一位以射箭技術聞名的老師。 據說老師的箭永遠不會錯過靶心。 他的技能吸引了許多學生。 有一天,老師讓他的一個學生蒙上他的眼睛。 然後,他讓學生設定一個目標,並給他弓箭。 所有的學生都屏住呼吸,看著老師。 在他們心中,老師的箭一定會射中目標。 就在眾人屏息凝視的時候,老師的箭離開了弓,沒有射中目標! 學生們目瞪口呆。 一名學生摘下師父的眼罩,問師父:“你怎麼可能打不中目標?” 大師回答——

“一個人無法擊中一個看不見的目標!”

掌握數據科學的主要步驟,相信我,我已經嘗試過了 UpGrad 博客
很久以前,我參加了一次教師培訓活動。 在其中一堂課中,我們被告知我們應該提前告知學生他們將在特定課程中學到什麼,因為這將幫助他們更好地為即將發生的事情做好準備。 當學生知道他們為什麼要學習他們正在學習的東西以及如何利用它時,學習就會發生最好的事情。 背景有助於促進學習。 在嘗試以創造性的方式解決難題的過程中,學習自然而然地發生,我們所學的東西會一直伴隨著我們。
我們如何將這些一般原則應用於數據科學? 掌握數據科學的第一步是有一個可衡量的目標。 您應該對數據充滿熱情和熱愛。 在今天的 Digi-verse 中,很容易迷路或分心。 平衡工作、家庭和學習使事情變得更加複雜。 因此,制定學習目標並認真執行至關重要。
數據分析創業指南

其次,練習是掌握任何技能的必要條件。 在《離群值》一書中,馬爾科姆·格拉德威爾聲稱掌握一項技能需要 10,000 小時。 關於這個數字存在一些爭議,但有一點很清楚:沒有練習,任何技能都無法掌握。 數據科學也不例外。 最好的方法是解決一個你關心的問題,一個能激勵你的問題。 為學而學不會長久,理論也會沿途被遺忘。
最近,我讀到一篇關於一名學生通過分析公開圖像幫助解決了檢測眼癌問題的文章。 她在途中學到了解決問題所需的一切,並取得了巨大的成就。 根據定義,數據科學是一門跨學科的學科。 它涉及線性代數、編程、統計、計算機基礎設施和更多領域。 這份長長的清單對我們所有想通過數據科學大門的人來說都是令人生畏的。

因此,最初專注於兩個或三個算法並嘗試將它們應用於您選擇的問題會對您有好處。 與其學習一點關於太陽底下的所有算法,不如深入探索一些。 目前,我們世界上的資源非常少,對它們的需求太高了。 以最佳方式使用數據科學可以幫助我們找到最好地利用這些稀缺資源的方法。
此外,在解決問題時嘗試進行實驗。 有幾種方法可以繼續進行,只有在嘗試過之後才會知道正確的方法。 實驗將使您準備好執行數據科學任務,例如提高算法的準確性、減少執行時間、並行化執行、使模型可以投入生產等。在我提供的許多工作面試中,一個常見的問題是關於我處理過的數據集或我已經解決的現實問題。 解決問題肯定也會成為你求職中的一大財富。
掌握數據科學的主要步驟,相信我,我已經嘗試過了 UpGrad 博客
傳達結果與分析本身一樣重要。 數據科學就是講故事。 在另一次採訪中,有人問我——

“你將如何向你的祖母解釋中位數?”

我不得不即興發揮用簡化的語言解釋複雜的行話。 在一個組織中,管理層通常不會了解行話,簡單有效的溝通將是關鍵。 嘗試向孩子(或祖父母!)解釋數據科學概念,看看他們是否理解。
數據科學家和分析師的薪水

最後,一切都歸結為可見性和存在。 作為有抱負的數據科學家,提高您的數字可視性至關重要。 創建一個 GitHub 帳戶,並上傳您的所有項目以進行展示。 為有關數據科學的博客做出貢獻。 加入數據科學小組並為正在進行的討論做出貢獻。 嘗試在 Quora、Reddit 和其他熱門論壇上回答問題。

這些是我在通往掌握數據科學的漫長道路上的一些思考。 你肯定會有其他的想法或建議。 請分享您的想法、文章、視頻和播客,或任何您認為對您的同行有幫助的東西,同時他們與您一起走這條艱鉅但令人興奮且非常充實的道路!

數據科學家的角色是什麼?

數據科學家在各個行業工作,與其他人合作開發可以組織和檢索大量數據的算法。 這些數據用於檢查公司過去的行動、制定戰略和製定未來計劃。 此外,數據科學家與整個組織或企業中的各種利益相關者合作,根據他們的數據推薦最佳行動方案。 他們負責向非技術專業人士解釋複雜的技術術語,如機器學習、大數據和數學建模。

從事數據科學職業需要哪些技能?

不可否認,就工作前景而言,數據科學是發展最快的職業之一。 數據科學用於各種應用,從簡單的銷售預測到自動駕駛汽車和個人助理。 熟練的數據科學家的需求量很大也就不足為奇了。 因此,要掌握數據科學,必須掌握一些技術和非技術技能,如 Python 和 R 編程、Hadoop、SQL 數據庫、機器學習和人工智能、數據可視化、商業策略、溝通、講故事、商業頭腦等。

數據科學的意義是什麼?

首先,企業和組織可以藉助數據科學技術將大量非結構化和原始數據轉化為相關見解。 其次,無論是大公司還是初創公司,數據科學都越來越受歡迎。 為了獲得更好的客戶體驗,谷歌、亞馬遜、Netflix 等處理大量數據的公司使用數據科學算法。 最後,數據科學正在協助交通自動化,例如開發自動駕駛汽車,這是未來的交通方式。 此外,不同的調查、選舉、機票確認和其他預測都可以從數據科學中受益。