想成為數據分析師? 這是掌握的頂級技能和工具
已發表: 2017-02-16處理數字和發現模式已成為 IT 行業的黃金標準。 數據分析師工作需求旺盛,LinkedIn 的 2017 年最有前途的工作將數據工程師列為第 9 位,分析經理將其列為第 18 位。
Glassdoor 對美國 50 項最佳工作的另一項研究顯示,數據科學家位居榜首,數據工程師緊隨其後,排名第三,分析經理位居令人羨慕的第五位。然而,佔據榜首並不容易。 如果您想在這一重大職業發展中實現同比增長和豐厚的薪酬待遇,您需要大量的數據分析技能。
雖然互聯網上充斥著關於如何掌握數據科學、情感分析和快速跟踪機器學習等基礎知識的免費資源。 Analytics India Magazine 和 UpGrad 通過列出成為數據分析師所需的 5 項基本技能來幫助您擺脫困境。
是什麼破壞了這 4 個 Martech 角色? 數據分析!目錄
擁有這些技能,讓自己在數據分析師工作中處於領先地位
讓我們從一些基礎知識開始:
學歷

不是每個人都能成為數據分析師。 你需要對數學和統計學有一種自然的傾向。 所有這些年學習微積分和概率的知識都會派上用場。 計算機科學學位總是一個額外的優勢。
統計學:要成為一名成熟的數據分析師,統計學的全面基礎是必不可少的。 擅長統計將幫助您深入了解算法以及何時應該使用它們。
複習應用統計學、線性代數、實分析、圖論和數值分析。 線性代數在回歸、理解數據結構以及為規範和預測數據建模準備數據方面發揮作用。
如何過渡到數據分析?編程技巧
1) 統計語言:
SAS vs R vs Python :在選擇分析工具時,這是一個讓大多數數據書呆子都頭疼的問題。 雖然 SAS(昂貴)和 Python(針對低規模數據處理收費)很容易學習,但 R(低級編程語言)憑藉其先進的計算能力、更好的圖形功能和先進的工具而勝出。
由於 R 是開源的,與 SAS 相比,特性和包可以快速添加。 R 蓬勃發展的另一個原因是它有一個龐大的生態系統支持它,以使其與豐富的功能保持同步。

專業提示:R 的商業吸引力使其成為家喻戶曉的名稱(閱讀:IT/技術重點公司),雖然 SAS 仍被企業廣泛使用,但這種統計語言正在流行。 但是 R 有一個陡峭的學習曲線。
2)查詢語言:
SQL:最古老的查詢語言之一, SQL 是一種通用數據庫語言,用於分析和事務查詢。 SQL 主要用於日常操作,無法支持 PB 級的數據。 Unity 教程等程序可以幫助您更深入地熟悉 PHP 和 MySQL。
Hive :這種 Hadoop 查詢語言是由 Facebook 的數據基礎設施團隊發明的。 從 Hive 於 2008 年開源之日起,它就成為了業務分析師的熱門選擇。 與 SQL 相比,使用稱為 HQL 的 SQL 類型語言的開源數據倉庫解決方案可以支持 TB 和 PB 的數據。 缺點是它只支持結構化數據。
定義銀行業未來的 5 個新數據分析角色
PIG: Pig 的最大優勢之一是它可以處理結構化和非結構化數據,並且可以在 MapReduce 上運行。 它是大多數傾向於編寫腳本的程序員的首選語言。 您需要做的是學習 Pig Latin,與 Hive 相比,它有助於更輕鬆地解決結構化/非結構化和半結構化問題。 這裡有一點歷史瑣事 - Pig 於 2006 年在 Yahoo 中創建,用於執行 MapReduce 作業。
專業提示: SQL 知識將有助於學習 Pig 和 Hive。
3) 腳本語言:

MATLAB:它是一種用於數據挖掘的語言。 有些人可能會爭辯說它的受歡迎程度已經下降。 把它放在你的武器庫裡不會有什麼壞處。 請記住,MATLAB 已經存在了很長時間,它是在 70 年代後期作為數據分析工具發明的。
Python:這是最流行的腳本語言之一,它的流行源於當前的堆棧。 核心庫 NumPy、SciPy、Pandas、matplotlib、IPython。 非常適合建模和分析。 但它有一個缺點——大型數據集的可擴展性。

專業提示: Python 擁有強大的社區,最適合用於抓取網站和數據工程。 你猜怎麼了? 非常簡單,非編程背景的人也能掌握!
機器學習
機器學習 (ML) 不僅僅是一個流行詞。 它正在跨領域發現很多實用性並獲得巨大的牽引力,因此成為數據專業人員需要具備的一項基本技能。 在機器學習中,回歸、分類和分割是分析師應該關注的廣泛學習領域。
2017 年將遵循的 6 個數據分析趨勢!數據可視化
您擁有所有這些數據; 現在你如何把它變成現實? 作為數據分析師,你的工作是製作令人回味的報告、發現趨勢並將這些發現傳達給高層。 要掌握的數據可視化工具有 Tableau、Microsoft Power BI、Oracle Visual Analyser、SAS Visual Analytics。 如果你喜歡 R,你可以使用ggplot 包來創建高度交互的圖表和圖形。
專業提示:不要只學習工具。 嘗試理解視覺編碼數據的動機。

數據分析初創公司指南
了解數據庫
本質上用於更好地了解客戶,數據庫分析通過各種工具從基本分析擴展到復雜的數據挖掘——地理信息系統 (GIS) 或文本分析。 分析數據庫的基本步驟是提取、清理、合併、分析和實現。
結帳:印度的數據分析師薪水
數據整理或數據整理
在開始從大量數據中提取洞察之前,必須清理數據。 說白了,就是需要有人做看門人的工作,也就是說,在分析之前手動清理數據並以統一的格式處理它。 到目前為止, excel已被用於清理和豐富數據,但斯坦福大學推出了一種交互式工具,一個名為 Wrangler 的正在進行中的工具。
專業提示:試一試 Wrangler,了解如何操作真實數據並將其導出以在 Tableau 或 R 中使用

數據分析師不需要像數據科學家這樣的高級技能。 但是,由於這些角色是多方面的,並且學習是一個持續的過程,因此有了額外的資源,您也可以成為初級數據科學家。
從本質上講,數學和統計學(32%)、計算機科學(19%)和工程學(16%)是數據科學家最重要的研究領域。 通常期望數據分析師精通 SAS 和/或 R 等語言。
我怎樣才能使我的薪水翻倍? 數據分析是您的答案建議具有計算機科學背景的人了解 Python、Hadoop 和 SQL 編碼。 此外,處理非結構化數據是數據分析師工作不可或缺的一部分。 習慣於非結構化數據庫是個好主意。 此外,數據分析師必須具備諸如培養商業頭腦或良好的溝通/演示技能等素質,因為這些技能將有助於保持領先地位。
從世界頂級大學在線學習數據科學課程。 獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。
這篇文章最初發表在 Analytics India 雜誌上。
哪種是數據分析的首選編碼語言?
Python 是世界上使用最多的數據分析編程語言。 它是一種開源的、用戶友好的編程語言,自今年以來一直存在。 它也是最方便的編程語言之一,因為它的語法簡單且沒有復雜性,有助於專注於自然語言。 由於易於理解和使用,Python 的腳本可以比其他編程語言更快地創建和執行。
數據分析需要哪些數學主題?
基本算術知識對於其他領域的數據科學初學者來說非常重要。 您需要對數學有深刻的理解,以及可靠地組合數字以創建新測量的能力。 為了滿足複利或折舊等典型的商業需求,數據分析師還應該熟悉統計和數學。 統計和概率、代數(基本和線性)、微積分和離散數學是數據分析師的四個基本數學學科。
學習數據分析值得嗎?
數據分析可能需要事先了解一些領域,例如 R、Python 等編程語言以及數學和統計概念。 但是,可以使用數據分析來研究這些主題。 通過掌握數據分析,您可以獲得廣泛的就業機會,包括業務分析師、數據科學家和數據分析師。 這些工作的薪水也很高,並提供了更多重要的晉昇機會。 這些職業處理重新排列數據,以便人和機器人都能理解它。
