데이터 과학을 마스터하기 위한 최고의 단계, 내가 시도한 것을 믿으세요

게시 됨: 2017-10-10

Thulasiram은 UpGrad 및 IIIT-Bangalore에서 데이터 분석 PG 디플로마를 받았으며 현재 UpGrad 에서 데이터 분석 프로그램 어소시에이트로 일하고 있습니다.
몇 년 전에 나는 The Monk Who Sold His Ferrari 라는 책에서 한 이야기를 읽었습니다 . 지금까지 기억나는 이야기입니다.
옛날에 활쏘기로 유명한 선생이 있었습니다. 선생님의 화살은 과녁을 절대 놓치지 않는다는 말이 있었다. 그의 기술은 많은 학생들을 매료시켰습니다. 어느 날, 선생님은 학생 중 한 명에게 눈가리개를 하라고 했습니다. 그런 다음 그는 학생에게 목표를 세우고 활과 화살을 주도록 요청했습니다. 학생들은 모두 숨을 죽이고 선생님을 바라보았다. 마음 속으로는 선생님의 화살이 과녁에 맞을 것이라고 확신했습니다. 모두가 숨죽이며 지켜보는 가운데 선생님의 화살이 활을 떠나 과녁을 빗나갔다! 학생들은 당황했다. 한 학생이 스승의 눈가리개를 풀고 “어떻게 과녁을 놓칠 수 있겠습니까?”라고 물었다. 주인은 이렇게 대답했습니다.

“눈에 보이지 않는 표적은 칠 수 없다!”

데이터 과학을 마스터하기 위한 최고의 단계, 저를 믿으세요. UpGrad Blog
오래전에 저는 교사 양성 행사에 참석했습니다. 강의 중 하나에서 우리는 특정 세션에서 배울 내용에 대해 학생들에게 미리 알려야 한다는 말을 들었습니다. 그래야 학생들이 앞으로 있을 수업을 더 잘 준비하는 데 도움이 되기 때문입니다. 학습은 학생들이 학습 내용을 배우는 이유와 학습 방법을 알 때 가장 잘 발생합니다. 컨텍스트는 학습을 촉진하는 데 도움이 됩니다. 어려운 문제를 창의적으로 해결하려고 하는 과정에서 자연스럽게 학습이 이루어지며, 배운 내용은 그대로 남게 됩니다.
이러한 일반 원칙을 데이터 과학에 어떻게 적용할 수 있습니까? 데이터 과학을 마스터하는 첫 번째 단계는 측정 가능한 목표를 갖는 것입니다. 데이터에 대한 열정과 사랑이 있어야 합니다. 오늘날의 Digi-verse에서는 길을 잃거나 주의가 산만해지기 쉽습니다. 일, 가족, 학습의 균형을 맞추면 모든 것이 더 복잡해집니다. 따라서 학습 목표를 설정하고 세심하게 따라가는 것이 중요합니다.
데이터 분석을 위한 스타트업 가이드

둘째, 어떤 기술이든 마스터하려면 연습이 필수입니다. Malcolm Gladwell은 Outliers 라는 책 에서 기술을 마스터하는 데 10,000시간이 걸린다고 주장합니다. 그 숫자에 대해 약간의 논란이 있지만 한 가지는 분명합니다. 연습 없이는 어떤 기술도 통달할 수 없다는 것입니다. 데이터 과학도 예외는 아닙니다. 가장 좋은 접근 방식은 관심 있는 문제, 영감을 주는 문제를 해결하는 것입니다. 배움을 위한 배움은 오래가지 못하고 이론은 그 과정에서 잊혀질 것입니다.
최근에 나는 공개된 이미지를 분석하여 안암 발견 문제를 해결하는 데 도움을 준 학생에 대한 기사를 읽었습니다. 그녀는 도중에 문제를 해결하는 데 필요한 모든 것을 배웠고 위대한 것을 성취했습니다. 데이터 과학은 정의에 따라 학제 간 주제입니다. 선형 대수학, 프로그래밍, 통계, 컴퓨터 인프라 및 더 많은 영역이 포함됩니다. 이 긴 목록은 데이터 과학의 문을 통과하려는 우리 모두에게 겁을 줍니다.

따라서 처음에는 두세 가지 알고리즘에 중점을 두고 선택한 문제에 이를 적용하는 것이 좋습니다. 태양 아래 있는 모든 알고리즘에 대해 조금 배우는 대신 몇 가지를 깊이 탐구하십시오. 현재 우리 세계의 자원은 매우 적고 그에 대한 수요는 너무 높습니다. 데이터 과학을 최적의 방식으로 사용하면 이러한 희소한 리소스를 가장 잘 활용하는 방법을 찾는 데 도움이 될 수 있습니다.
또한 문제를 해결할 때 실험을 시도하십시오. 여러 가지 방법으로 진행할 수 있으며 시도한 후에만 올바른 방법을 알 수 있습니다. 실험을 통해 알고리즘의 정확도 향상, 실행 시간 단축, 실행 병렬화, 모델 생산 준비 등과 같은 데이터 과학 작업을 수행할 수 있습니다. 제가 제공한 많은 면접에서 공통적으로 질문은 내가 처리한 데이터 세트나 내가 해결한 실제 문제에 관한 것이었습니다. 문제를 해결하는 것은 확실히 구직 활동에서도 큰 자산이 될 것입니다.
데이터 과학을 마스터하기 위한 최고의 단계, 저를 믿으세요. UpGrad Blog
결과를 전달하는 것은 분석 자체만큼 중요합니다. 데이터 과학은 모두 스토리텔링에 관한 것입니다. 다른 인터뷰에서 나는 다음과 같은 질문을 받았습니다.

“할머니에게 중앙값을 어떻게 설명할 건가요?”

복잡한 전문 용어를 단순화된 단어로 설명하기 위해 즉흥적으로 해야 했습니다. 조직에서 경영진은 전문 용어를 인식하지 못하는 경우가 많으며 간단하고 효과적인 의사 소통이 핵심입니다. 데이터 과학 개념을 어린이(또는 조부모님!)에게 설명하고 이해하는지 확인하십시오.
데이터 과학자 및 분석가의 급여

마지막으로 모든 것은 가시성과 존재감으로 귀결됩니다. 데이터 과학자 지망생으로서 디지털 가시성을 향상시키는 것은 매우 중요합니다. GitHub 계정을 만들고 전시용으로 모든 프로젝트를 업로드하세요. 데이터 과학에 관한 블로그에 기고하십시오. 데이터 과학 그룹에 가입하고 진행 중인 토론에 참여하십시오. Quora, Reddit 및 기타 인기 있는 포럼에서 질문에 답변해 보세요.

이것은 데이터 과학 숙달을 위한 긴 길을 걷는 것에 대한 나의 명상 중 일부입니다. 분명히 다른 아이디어나 제안이 있을 것입니다. 당신의 생각, 기사, 비디오, 팟캐스트 또는 동료들이 험난하지만 흥미롭고 매우 성취감 넘치는 이 길을 함께 걷는 동안 도움이 될 것이라고 생각하는 모든 것을 공유하십시오!

데이터 과학자의 역할은 무엇입니까?

데이터 과학자는 다양한 산업 분야에서 일하며 다른 사람들과 협력하여 방대한 양의 데이터를 구성하고 검색할 수 있는 알고리즘을 개발합니다. 이 데이터는 회사의 과거 행동을 검토하고 전략을 수립하고 미래 계획을 세우는 데 활용됩니다. 또한 데이터 과학자는 조직 또는 비즈니스 전반에 걸쳐 다양한 이해 관계자와 협력하여 데이터를 기반으로 최상의 조치를 권장합니다. 머신 러닝, 빅 데이터, 수학적 모델링과 같은 복잡한 기술 전문 용어를 비기술 전문가에게 설명하는 업무를 담당합니다.

데이터 과학 분야에서 경력을 쌓기 위해 필요한 기술은 무엇입니까?

데이터 과학은 직업 전망 측면에서 가장 빠르게 확장되고 있는 직업 중 하나입니다. 데이터 사이언스는 단순한 판매 예측에서 자율주행 자동차 및 개인 비서에 이르기까지 다양한 응용 분야에서 사용됩니다. 숙련된 데이터 과학자에 대한 수요가 높은 것은 놀라운 일이 아닙니다. 따라서 데이터 과학을 마스터하려면 Python 및 R 프로그래밍, Hadoop, SQL 데이터베이스, 기계 학습 및 AI, 데이터 시각화, 비즈니스 전략, 커뮤니케이션, 스토리텔링, 비즈니스 통찰력 등과 같은 기술 및 비기술적 기술을 습득해야 합니다.

데이터 과학의 중요성은 무엇입니까?

첫째, 기업과 조직은 데이터 과학 기술의 도움을 받아 대량의 비정형 및 원시 데이터를 관련 통찰력으로 전환할 수 있습니다. 둘째, 대기업이든 신생 기업이든 데이터 과학은 점점 대중화되고 있습니다. 더 나은 고객 경험을 위해 Google, Amazon, Netflix와 같은 많은 데이터를 처리하는 회사는 데이터 과학 알고리즘을 사용합니다. 마지막으로 데이터사이언스는 미래의 교통수단인 자율주행자동차의 개발 등 교통의 자동화를 지원하고 있다. 또한 다양한 설문 조사, 선거, 항공권 확인 및 기타 예측이 모두 데이터 과학의 이점을 얻을 수 있습니다.