掌握数据科学的主要步骤,相信我,我已经尝试过了

已发表: 2017-10-10

Thulasiram 从 UpGrad 和 IIIT-Bangalore 获得了数据分析的 PG 文凭,现在在 UpGrad 工作,担任 UpGrad 的数据分析项目助理
多年前,我在《卖掉法拉利的和尚》一书中读到一个故事,这个故事我至今记忆犹新。
从前有一位以射箭技术闻名的老师。 据说老师的箭永远不会错过靶心。 他的技能吸引了许多学生。 有一天,老师让他的一个学生蒙上他的眼睛。 然后,他让学生设定一个目标,并给他弓箭。 所有的学生都屏住呼吸,看着老师。 在他们心中,老师的箭一定会射中目标。 就在众人屏息凝视的时候,老师的箭离开了弓,没有射中目标! 学生们目瞪口呆。 一名学生摘下师父的眼罩,问师父:“你怎么可能打不中目标?” 大师回答——

“一个人无法击中一个看不见的目标!”

掌握数据科学的主要步骤,相信我,我已经尝试过了 UpGrad 博客
很久以前,我参加了一次教师培训活动。 在其中一个讲座中,我们被告知我们应该提前告知学生他们将在特定课程中学到什么,因为这将帮助他们更好地为即将发生的事情做好准备。 当学生知道他们为什么要学习他们正在学习的东西以及如何利用它时,学习就会发生最好的事情。 背景有助于促进学习。 在尝试以创造性的方式解决难题的过程中,学习自然而然地发生,我们所学的东西会一直伴随着我们。
我们如何将这些一般原则应用于数据科学? 掌握数据科学的第一步是有一个可衡量的目标。 您应该对数据充满热情和热爱。 在今天的 Digi-verse 中,很容易迷路或分心。 平衡工作、家庭和学习使事情变得更加复杂。 因此,制定学习目标并认真执行至关重要。
数据分析创业指南

其次,练习是掌握任何技能的必要条件。 在《离群值》一书中,马尔科姆·格拉德威尔声称掌握一项技能需要 10,000 小时。 关于这个数字存在一些争议,但有一点很清楚:没有练习,任何技能都无法掌握。 数据科学也不例外。 最好的方法是解决一个你关心的问题,一个能激励你的问题。 为学而学不会长久,理论也会沿途被遗忘。
最近,我读到一篇关于一名学生通过分析公开图像帮助解决了检测眼癌问题的文章。 她在途中学到了解决问题所需的一切,并取得了巨大的成就。 根据定义,数据科学是一门跨学科的学科。 它涉及线性代数、编程、统计、计算机基础设施和更多领域。 这份长长的清单对我们所有想通过数据科学大门的人来说都是令人生畏的。

因此,最初专注于两个或三个算法并尝试将它们应用于您选择的问题会对您有好处。 与其学习一点关于太阳底下的所有算法,不如深入探索一些。 目前,我们世界上的资源非常少,对它们的需求太高了。 以最佳方式使用数据科学可以帮助我们找到最好地利用这些稀缺资源的方法。
此外,在解决问题时尝试进行实验。 有几种方法可以继续进行,只有在尝试过之后才会知道正确的方法。 实验将使您准备好执行数据科学任务,例如提高算法的准确性、减少执行时间、并行化执行、使模型可以投入生产等。在我提供的许多工作面试中,一个常见的问题是关于我处理过的数据集或我已经解决的现实问题。 解决问题肯定也会成为你求职中的一大财富。
掌握数据科学的主要步骤,相信我,我已经尝试过了 UpGrad 博客
传达结果与分析本身一样重要。 数据科学就是讲故事。 在另一次采访中,有人问我——

“你将如何向你的祖母解释中位数?”

我不得不即兴发挥用简化的语言解释复杂的行话。 在一个组织中,管理层通常不会了解行话,简单有效的沟通将是关键。 尝试向孩子(或祖父母!)解释数据科学概念,看看他们是否理解。
数据科学家和分析师的薪水

最后,一切都归结为可见性和存在。 作为有抱负的数据科学家,提高您的数字可视性至关重要。 创建一个 GitHub 帐户,并上传您的所有项目以进行展示。 为有关数据科学的博客做出贡献。 加入数据科学小组并为正在进行的讨论做出贡献。 尝试在 Quora、Reddit 和其他热门论坛上回答问题。

这些是我在通往掌握数据科学的漫长道路上的一些思考。 你肯定会有其他的想法或建议。 请分享您的想法、文章、视频和播客,或任何您认为对您的同行有帮助的东西,同时他们与您一起走这条艰巨但令人兴奋且非常充实的道路!

数据科学家的角色是什么?

数据科学家在各个行业工作,与其他人合作开发可以组织和检索大量数据的算法。 这些数据用于检查公司过去的行动、制定战略和制定未来计划。 此外,数据科学家与整个组织或企业中的各种利益相关者合作,根据他们的数据推荐最佳行动方案。 他们负责向非技术专业人士解释复杂的技术术语,如机器学习、大数据和数学建模。

从事数据科学职业需要哪些技能?

不可否认,就工作前景而言,数据科学是发展最快的职业之一。 数据科学用于各种应用,从简单的销售预测到自动驾驶汽车和个人助理。 熟练的数据科学家的需求量很大也就不足为奇了。 因此,要掌握数据科学,必须掌握一些技术和非技术技能,如 Python 和 R 编程、Hadoop、SQL 数据库、机器学习和人工智能、数据可视化、商业策略、沟通、讲故事、商业头脑等。

数据科学的意义是什么?

首先,企业和组织可以借助数据科学技术将大量非结构化和原始数据转化为相关见解。 其次,无论是大公司还是初创公司,数据科学都越来越受欢迎。 为了获得更好的客户体验,谷歌、亚马逊、Netflix 等处理大量数据的公司使用数据科学算法。 最后,数据科学正在协助交通自动化,例如开发自动驾驶汽车,这是未来的交通方式。 此外,不同的调查、选举、机票确认和其他预测都可以从数据科学中受益。