想成为数据分析师? 这是掌握的顶级技能和工具

已发表: 2017-02-16

处理数字和发现模式已成为 IT 行业的黄金标准。 数据分析师工作需求旺盛,LinkedIn 的 2017 年最有前途的工作将数据工程师列为第 9 位,分析经理将其列为第 18 位。

Glassdoor 对美国 50 个最佳工作的另一项研究显示,数据科学家位居榜首,数据工程师紧随其后,排名第三,分析经理位居令人羡慕的第五位。然而,占据榜首并不容易。 如果您想在这一重大职业发展中实现同比增长和丰厚的薪酬待遇,您需要大量的数据分析技能。

虽然互联网上充斥着关于如何掌握数据科学、情感分析和快速跟踪机器学习等基础知识的免费资源。 Analytics India Magazine 和 UpGrad 通过列出成为数据分析师所需的 5 项基本技能来帮助您摆脱困境。

是什么破坏了这 4 个 Martech 角色? 数据分析!

目录

拥有这些技能,让自己在数据分析师工作中处于领先地位

让我们从一些基础知识开始:

学历

想成为数据分析师?这是掌握 UpGrad 博客的顶级技能和工具
不是每个人都能成为数据分析师。 你需要对数学统计学有一种自然的倾向。 所有这些年学习微积分和概率的知识都会派上用场。 计算机科学学位总是一个额外的优势。
统计学:要成为一名成熟的数据分析师,统计学的全面基础是必不可少的。 擅长统计将帮助您深入了解算法以及何时应该使用它们。

复习应用统计学、线性代数、实分析、图论和数值分析。 线性代数在回归、理解数据结构以及为规范和预测数据建模准备数据方面发挥作用。

如何过渡到数据分析?

编程技巧

1) 统计语言:

SAS vs R vs Python :在选择分析工具时,这是一个让大多数数据书呆子都头疼的问题。 虽然 SAS(昂贵)和 Python(收费用于低规模数据处理)很容易学习,但 R(低级编程语言)凭借其先进的计算能力、更好的图形功能和先进的工具而胜出。

由于 R 是开源的,与 SAS 相比,特性和包可以快速添加。 R 蓬勃发展的另一个原因是它有一个庞大的生态系统支持它,以使其与丰富的功能保持同步。

数据分析师技能和工具
专业提示:R 的商业吸引力使其成为家喻户晓的名称(阅读:IT/技术重点公司),虽然 SAS 仍被企业广泛使用,但这种统计语言正在流行。 但是 R 有一个陡峭的学习曲线。

2)查询语言:

SQL:最古老的查询语言之一 SQL 是一种通用数据库语言,用于分析和事务查询。 SQL 主要用于日常操作,无法支持 PB 级的数据。 Unity 教程等程序可以帮助您更深入地熟悉 PHP 和 MySQL。

Hive :这种 Hadoop 查询语言是由 Facebook 的数据基础设施团队发明的。 从 Hive 于 2008 年开源之日起,它就成为了业务分析师的热门选择。 与 SQL 相比,使用称为 HQL 的 SQL 类型语言的开源数据仓库解决方案可以支持 TB 和 PB 的数据。 缺点是它只支持结构化数据。

定义银行业未来的 5 个新数据分析角色

数据分析师技能和工具
PIG: Pig 的最大优势之一是它可以处理结构化和非结构化数据,并且可以在 MapReduce 上运行。 它是大多数倾向于编写脚本的程序员的首选语言。 您需要做的是学习 Pig Latin,与 Hive 相比,它有助于更​​轻松地解决结构化/非结构化和半结构化问题。 这里有一点历史琐事 - Pig 于 2006 年在 Yahoo 中创建,用于执行 MapReduce 作业。

专业提示: SQL 知识将有助于学习 Pig 和 Hive。

3) 脚本语言:

MATLAB:它是一种用于数据挖掘的语言。 有些人可能会争辩说它的受欢迎程度已经下降。 把它放在你的武器库里不会有什么坏处。 请记住,MATLAB 已经存在了很长时间,它是在 70 年代后期作为数据分析工具发明的。

Python:这是最流行的脚本语言之一,它的流行源于当前的堆栈。 核心库 NumPy、SciPy、Pandas、matplotlib、IPython。 非常适合建模和分析。 但它有一个缺点——大型数据集的可扩展性。

数据分析师技能和工具
专业提示: Python 拥有强大的社区,最适合用于抓取网站和数据工程。 你猜怎么了? 非常简单,非编程背景的人也能掌握!

机器学习

机器学习 (ML) 不仅仅是一个流行词。 它正在跨领域发现很多实用性并获得巨大的牵引力,因此成为数据专业人员需要具备的一项基本技能。 在机器学习中,回归、分类和分割是分析师应该关注的广泛学习领域。

2017 年将遵循的 6 个数据分析趋势!

数据可视化

您拥有所有这些数据; 现在你如何把它变成现实? 作为数据分析师,你的工作是制作令人回味的报告、发现趋势并将这些发现传达给高层。 要掌握的数据可视化工具有 Tableau、Microsoft Power BI、Oracle Visual Analyser、SAS Visual Analytics。 如果你喜欢 R,你可以使用ggplot 包来创建高度交互的图表和图形。
专业提示:不要只学习工具。 尝试理解视觉编码数据的动机。

数据分析师技能和工具
数据分析初创公司指南

了解数据库

本质上用于更好地了解客户,数据库分析通过各种工具从基本分析扩展到复杂的数据挖掘——地理信息系统 (GIS) 或文本分析。 分析数据库的基本步骤是提取、清理、合并、分析和实现。

结帐:印度的数据分析师薪水

数据整理或数据整理

在开始从大量数据中提取洞察之前,必须清理数据。 说白了,就是需要有人做看门人的工作,也就是说,在分析之前手动清理数据并以统一的格式处理它。 到目前为止, excel已被用于清理和丰富数据,但斯坦福大学推出了一种交互式工具,一个名为 Wrangler 的正在进行中的工具。

专业提示:试一试 Wrangler,了解如何操作真实数据并将其导出以在 Tableau 或 R 中使用

数据分析师技能和工具
数据分析师不需要像数据科学家这样的高级技能。 但是,由于这些角色是多方面的,并且学习是一个持续的过程,因此有了额外的资源,您也可以成为初级数据科学家。

从本质上讲,数学和统计学(32%)、计算机科学(19%)和工程学(16%)是数据科学家最重要的研究领域。 通常期望数据分析师精通 SAS 和/或 R 等语言。

我怎样才能使我的薪水翻倍? 数据分析是您的答案

建议具有计算机科学背景的人了解 Python、Hadoop 和 SQL 编码。 此外,处理非结构化数据是数据分析师工作不可或缺的一部分。 习惯于非结构化数据库是个好主意。 此外,数据分析师必须具备诸如培养商业头脑或良好的沟通/演示技能等素质,因为这些技能将有助于保持领先地位。

从世界顶级大学在线学习数据科学课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。


这篇文章最初发表在 Analytics India 杂志上。

哪种是数据分析的首选编码语言?

Python 是世界上使用最多的数据分析编程语言。 它是一种开源的、用户友好的编程语言,自今年以来一直存在。 它也是最方便的编程语言之一,因为它的语法简单且没有复杂性,有助于专注于自然语言。 由于易于理解和使用,Python 的脚本可以比其他编程语言更快地创建和执行。

数据分析需要哪些数学主题?

基本算术知识对于其他领域的数据科学初学者来说非常重要。 您需要对数学有深刻的理解,以及可靠地组合数字以创建新测量的能力。 为了满足复利或折旧等典型的商业需求,数据分析师还应该熟悉统计和数学。 统计和概率、代数(基本和线性)、微积分和离散数学是数据分析师的四个基本数学学科。

学习数据分析值得吗?

数据分析可能需要事先了解一些领域,例如 R、Python 等编程语言以及数学和统计概念。 但是,可以使用数据分析来研究这些主题。 通过掌握数据分析,您可以获得广泛的就业机会,包括业务分析师、数据科学家和数据分析师。 这些工作的薪水也很高,并提供了更多重要的晋升机会。 这些职业处理重新排列数据,以便人和机器人都能理解它。