데이터 분석에서 요리란? UpGrad의 팀 데이터가 말합니다!
게시 됨: 2016-12-24Team Data Analytics는 UpGrad에서 일하는 전문가들을 위한 가장 몰입도 높은 학습 경험을 만들고 있습니다.
Data Insider는 최근 데이터 분석 산업에 대한 통찰력을 얻기 위해 저를 확인했습니다. 오늘날의 개발자가 주의해야 할 트렌드와 필수 기술 세트를 포함합니다. 진행 방법은 다음과 같습니다.
목차
오늘날 데이터 분석 산업의 경쟁력은 어느 정도입니까? 이러한 유형의 전문가에 대한 수요는 무엇입니까?
널리 인용되는 McKinsey 보고서에 따르면 미국은 2018년까지 약 150만 명의 데이터 전문가 부족에 직면할 것이라고 합니다. 글로벌 분석 허브로 부상하고 있는 인도에서는 이러한 전문가 부족이 심화될 수 있습니다. 최대 200,000까지. 인도에서만 2015년 6월부터 2016년 6월까지 분석 작업의 수가 120% 증가했습니다. 따라서 우리에게는 분명히 도전 과제가 있습니다. 당연히 인재 부족이 심각하기 때문에 인재에 대한 수요가 높습니다.
쉬운 분석 vs. 쉽지 않은 분석 디코딩오늘날 데이터 분석 업계에서 어떤 트렌드를 따르고 있습니까? 왜 그들에게 관심이 있습니까?
우리가 주의해야 할 세 가지 주요 추세가 있습니다.
개인화
개인화된 시스템을 만들기 위해 데이터를 사용하는 것이 전반적으로 매우 빠르게 채택되고 있는 핵심 추세라고 생각합니다. 대부분의 인터넷 서비스는 온라인 이용자의 익명성을 없애고 차별화된 대우를 지향하고 있다. 예를 들어, 메시지를 입력할 때 단어 추천 또는 Uber를 사용할 때 대상 추천을 입력합니다.
무어의 법칙의 끝
조심해야 할 또 다른 흥미로운 추세는 무어의 법칙의 종말에 도달함에 따라 기업이 점점 더 창의적으로 변해가는 방식입니다. 무어의 법칙(Moore's Law)은 본질적으로 2년 전에 칩에 장착할 수 있었던 트랜지스터의 수를 2년마다 두 배로 늘릴 수 있다고 명시하고 있습니다. 이 법칙 때문에 우리는 전체 데이터 혁명을 책임지는 방대한 양의 데이터를 저장하고 처리하는 능력을 발휘했습니다. 하지만 다음에 무슨 일이 일어날까요?
사물인터넷
또 다른 트렌드는 그것이 가져오는 순전한 가능성 때문에 주의해야 합니다. 클라우드, 빅데이터, 사물인터넷(IoT)이 결합해 가능한 스마트 시스템의 등장이다.
오늘날 데이터 엔지니어에게 중요한 기술은 무엇입니까? 경쟁력을 유지하려면 무엇을 알아야 합니까?
훌륭한 데이터 과학자는 다음 세 가지 영역이 드물게 겹치는 위치에 있습니다.
도메인 지식
이것은 비즈니스 문제의 미묘한 차이를 이해하고 이해하는 데 도움이 됩니다. 예를 들어 전자 상거래 회사는 구매자에게 보완 제품을 추천 하려고 합니다.
통계 지식
통계 및 수학적 지식은 데이터 기반 의사 결정에 도움이 됩니다. 예를 들어, 장바구니 분석 을 사용하여 특정 구매에 대한 보완 제품을 찾을 수 있습니다.

기술 지식
이는 대규모로 복잡한 분석을 수행하는 데 도움이 됩니다. 예를 들어 구매자가 노트북을 사는 동안 펜도 사는 것을 선호할 수 있음을 보여주는 추천 시스템을 만드는 것과 같습니다.
데이터 분석으로 어떻게 전환할 수 있습니까?
기술 전문성 외에 데이터 분석 및 비즈니스 인텔리전스 분야에서 반드시 개발해야 하는 다른 기술은 무엇입니까?
궁극적으로 데이터 과학자는 문제 해결사입니다. 그리고 모든 문제에는 구체적인 맥락, 내용, 스토리가 있습니다. 여기에서 이러한 모든 요소를 공통의 내러티브로 연결하는 것이 매우 중요합니다. 기본적으로 모든 데이터 전문가는 훌륭한 스토리텔러가 되어야 합니다.
이와 관련하여 분석가가 연마해야 할 핵심 기술 중 하나는 함께 작업하는 다른 사람들을 위해 분석의 복잡성을 분해하는 것입니다. 그들은 파생된 실제 통찰력을 평가할 수 있고 공통의 비즈니스 목표를 향해 일할 수 있습니다.
또한 끊임없이 배우는 습관을 들이는 것도 중요합니다. 매일 아침 일어나서 귀하의 도메인에서 관련성이 있고 최신 정보를 읽는 것을 의미하더라도.
이 전문가들은 현장의 트렌드와 혁신보다 앞서기 위해 무엇을 해야 합니까?
오늘날의 전문가들은 지속적으로 스스로의 기술을 향상시켜야 하고 기꺼이 버리고 다시 배워야 합니다. 데이터 분석과 같은 기술 집약적 분야의 작업 세계와 산업 환경은 매년 변화하고 있습니다. 앞서 나가거나 이러한 추세와 동등하게 유지하는 유일한 방법은 학습에 투자하고 흥미진진한 산업 관련 프로젝트를 수행하고 Kaggle 등과 같은 대회에 참여하는 것입니다.
데이터 산업에서 멘토링은 얼마나 중요합니까? 전문가가 경력과 기술을 발전시키는 데 도움을 줄 수 있는 사람은 누구입니까?
아주 중요한. 이 영역이 얼마나 빨리 등장했는지를 고려할 때 일반적으로 학계와 대학은 똑같이 빠르게 따라갈 기회가 없었습니다. 따라서 이 영역과 관련하여 산업 관련성을 유지하는 유일한 방법은 산업별 학습을 수행하는 것입니다.
이는 두 가지 방법으로만 수행할 수 있습니다. 실제 사례 연구와 현직/고위 전문가이고 데이터 분석 업계에서 온 멘토를 통해서입니다.
사실 UpGrad에서는 데이터 전문가 지망생을 위한 업계 멘토링에 대해 많은 스트레스를 받고 있습니다. 이는 전체 사례 연구 및 산업 관련 프로젝트에 추가됩니다.
세계 최고의 대학에서 데이터 과학 인증 을 받으십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 통해 경력을 빠르게 추적하십시오.
데이터 전문가가 멘토를 찾을 수 있는 가장 좋은 곳은 어디인가요?
신진 또는 야심 찬 데이터 전문가가 네트워크를 활용하여 적합한 멘토를 찾는 것이 중요하지만 그렇게 하는 것은 사실 어려운 일입니다. 이에 대해 비난할 수 있는 두 가지 주요 이유가 있습니다.
- 첫째, 산업이 초기 단계에 있기 때문에 멘토가 되기 위해 필요한 역량을 갖춘 사람을 찾기가 매우 어렵습니다.
- 현장에서 상당한 경험을 가진 사람을 찾더라도 모든 사람이 효과적인 멘토가 될 시간과 의향이 있는 것은 아닙니다. 따라서 대부분의 사람들은 멘토링을 받으려면 어디로 가야할지 모릅니다.
풍부한 산업 관련 학습 경험을 제공하는 UpGrad와 같은 플랫폼이 바로 여기에 있습니다. 다른 곳에서는 매우 고위 및 평판이 좋은 전문가의 멘토링을 위해 이렇게 광범위한 산업 제휴 또는 협회를 찾을 수 없습니다.
데이터 분석으로 어떻게 전환할 수 있습니까?데이터 분석 업계의 사람들은 개발, 추세 및 기술에 대한 교육과 최신 정보를 얻기 위해 어떤 리소스를 사용해야 합니까?
많이있다. 우선, Data Skeptic, Freakonomics, Talking Machines 등과 같은 팟캐스트를 따라갈 수 있도록 야심찬/현재 데이터 분석가에게 도움이 되는 훌륭하고 흥미로운 블로그와 리소스가 있습니다.
이 인터뷰는 원래 Data Insider에 게시되었습니다.
upGrad의 학생 멘토링은 어떻게 이루어지나요?
학생 멘토는 학습자가 긍정적인 학습 경험을 갖도록 하고, 질문을 지원하고, 원하는 방향으로 경력 전환을 위한 조치를 준비하고, 영감과 격려를 제공하면서 학습자와 몇 달 동안 협력합니다. upGrad에서 '학생 멘토'는 진로를 바꾸고자 하는 학습자(upGrad 학생)와 더 나은 직업을 통해 더 밝은 미래를 건설하고자 하는 학습자(upGrad 학생)의 삶에서 비슷한 역할을 합니다. 학생 멘토는 학생 그룹에 배정되며 정보를 제공하고 학업 이외의 문제에 대해서도 도움을 줄 책임이 있습니다. 그들은 학생들이 upGrad에서 긍정적인 경험을 할 수 있도록 많은 노력을 기울였습니다.
데이터 엔지니어링 분야에서 경력을 쌓기 위해 필요한 필수 기술은 무엇입니까?
기본적으로 데이터 엔지니어의 역할은 데이터베이스 시스템을 만들고 관리하는 것입니다. 이를 위해서는 SQL, Python 및 R과 같은 프로그래밍 언어에 능숙해야 합니다. 또한 웨어하우징 솔루션 및 ETL 도구에 대한 지식이 있어야 하며 기계 학습 및 알고리즘에 대한 기본 이해가 있어야 합니다.
의사 소통 및 협력과 같은 소프트 기술도 데이터 엔지니어의 기술 세트에 포함되어야 합니다. 데이터 과학은 고도로 협력적인 분야이며 데이터 엔지니어는 데이터 분석가에서 최고 기술 책임자에 이르기까지 다양한 이해 관계자와 협력합니다.
Kaggle의 기능은 무엇입니까?
사용자는 Kaggle을 사용하여 데이터 세트를 찾아 게시하고, 웹 기반 데이터 과학 환경에서 모델을 연구 및 개발하고, 다른 데이터 과학자 및 기계 학습 전문가와 협력하고, 데이터 과학 경연 대회에서 경쟁할 수 있습니다. Kaggle에서는 무료로 시작할 수 있습니다. R 및 Python 코드가 모두 제공됩니다. 각 토너먼트에 대한 토론 게시판이 있어 질문을 하고 특정 주제를 찬성할 수 있습니다.
