그들은 데이터가 새로운 석유라고 말합니다 – 정말입니까?
게시 됨: 2018-01-05high in demand 데이터 전문가 에 대한 수요가 높고 perks get there 데이터 관련 직업의 장점은 무엇이며 어떻게 얻을 있습니까 모든 것을 이해합시다.
목차
빅데이터란 정확히 무엇인가?
평상시에는 통화, 소셜 미디어 사용, 사진, 위치 추적, 쇼핑 청구서 등을 통해 개별적으로 약 10GB의 데이터를 생성합니다. 기술에 액세스할 수 있는 모든 개인에 대해 이 모든 것을 누적하면 전 세계적으로 생성되는 10억 GB의 데이터를 볼 수 있습니다. 그것이 충분히 크게 들린다면 간단히 "빅 데이터"라고 부를 수 있습니다.
좋아, 데이터가 많다. 그래서 무엇?
연구원과 기술 대기업은 이 데이터의 중요성을 이해하고 이 데이터를 처리 , 탐색 및 활용할 수 있는 사람을 찾기 시작했습니다 . 그것은 각각 Data Engineer , Data Analyst 및 Data Scientist라는 3개의 새롭고 미친 주문형 타이틀을 탄생시켰습니다.
데이터 과학자 | 데이터 엔지니어 | 데이터 분석가 | |
| 역할 | (빅) 데이터에서 인사이트를 정리, 구성 및 생성 | 데이터 시스템 및 소스 관리, 보호, 중앙 집중화 및 통합 | 데이터 수집, 처리 및 통계 분석 수행 |
| 사고방식 | 빅데이터를 활용한 AI 생성 | 손쉬운 데이터 아키텍처 설계 | 데이터에서 인사이트 도출 |
| 기술 | 머신 러닝, 분산 컴퓨팅 및 데이터 시각화 | 데이터 웨어하우징, 데이터베이스 아키텍처, ETL(Extract-Transform-Load) 작업 및 시스템 관리 | 커뮤니케이션 및 시각화, 스프레드시트 도구 및 비즈니스 기반 인텔리전스 |
| 도구 및 언어 | 파이썬, R, SQL, 스파크, 맵리듀스 | 하둡, 스파크, 하이브, PIG, SQL | SAS, VBA, R, Excel, Tableau |
| 평균 연봉 | $125000 | $110000 | $90000 |
쿨, 우리는 그들이 하는 일을 이해합니다. 그런데 왜 과대 광고를 합니까?
데이터 과학자, 데이터 분석가 및 데이터 엔지니어는 누구입니까?
몇 가지 성공 사례를 살펴보겠습니다.
Xerox: 빅 데이터 솔루션으로 전환한 후 회사는 접근 방식을 전환하여 Xerox가 고용 패러다임을 재구성하고 지원 인력의 이직률을 20% 낮추어 장기적으로 회사에서 수백만 달러를 절약했습니다.
IBM: 'The Weather Company'를 인수하고 100,000개 이상의 기상 모니터링 센서, 특수 항공기, 가제트의 앱 및 기타 다양한 장치에서 수집한 빅 데이터를 활용하여 IBM Watson은 지속적인 기상 모니터링을 가능하게 하는 22억 개 이상의 고유한 데이터 수집 지점의 이점을 누리고 있습니다. $500,000,000 날씨로 인한 손실과 피해 는 미국에서만 연간 거의 $500,000,000 에 달합니다.
Paypal: 수십억 개의 기록을 분석하여 업계 최고의 손실률 0.5%를 달성하는 자동화된 사기 탐지 시스템을 개발했습니다.
Tesla: 각 차량의 온보드 컴퓨터에서 생성된 방대한 데이터를 분석하여 엔지니어는 부품 고장, 잠재적인 안전 문제, 자동 제어 및 비상 잠금을 예측할 수 있습니다.
수십억 달러를 감당할 수 있는 거물이라고 생각할 수도 있습니다!
중소기업은 어떻습니까? 빅 데이터 투자가 그들에게 가치가 있습니까?
AWS, Google Cloud 또는 Azure와 같은 클라우드 제공업체의 서비스뿐만 아니라 시장에서 사용할 수 있는 기성품 솔루션이 많이 있습니다. 이 모든 것이 빅 데이터 분석 도구를 상당히 저렴하게 만듭니다. 일반 중견 스타트업은 이러한 서비스의 혜택을 받으며 클라우드 서비스를 활용하는 일부 인기 있는 인도 회사는 Freshdesk, Sigtuple, Paralleldots 등입니다.
스타트업에서 구글, 페이스북, 애플, 마이크로소프트 등과 같은 거대 기술 기업이 빅 데이터를 처리하고 이를 통해 경이로움을 만드는 연구를 발전시키기 위해 AI 연구소를 설립했습니다.
당신을 둘러싼 빅 데이터 애플리케이션
데이터 전문가가 특별한 이유는 무엇입니까?
데이터 전문가의 사고 방식에 대해 더 깊이 들어가 보겠습니다. 훌륭한 데이터 전문가를 다른 DSA(데이터 과학 및 분석) 역할과 구분하는 가장 도전적이고 독특한 기술은 빅 데이터를 사용하는 능력입니다. 매초 엄청난 양의 데이터가 흘러들어가는 상황에서 의미 있는 정보를 즉석에서 처리하고 추출하기가 어려워집니다.
데이터 전문가는 일반적으로 기계 학습 또는 딥 러닝이라고 불리는 고급 알고리즘과 기술의 조합을 사용하여 이 빅 데이터 문제를 해결합니다.

Google 어시스턴트, Siri, Alexa, Cortana, Prisma, Snapchat 필터, Facebook 위치, 얼굴 태깅 등은 모두 기계 학습의 예입니다. 이러한 모든 기술의 핵심에는 딥 러닝 또는 인공 지능에 연료와 생명을 제공하는 빅 데이터 의 씨앗이 있습니다.

무엇이 빅 데이터를 새로운 석유로 만드는가
방대한 빅 데이터는 미개척 기회의 광대한 바다입니다. 기술 대기업들은 이 빅 데이터 깊숙이 숨겨진 중요한 정보를 드릴다운하고 추출하기 위해 수십억 달러를 투자하고 있습니다. 현대 경제에서 매우 유사한 필수 자원인 원유와 직접 비교하면 빅 데이터는 실제로 미래를 위한 새로운 석유/연료입니다.
" 인공지능은 새로운 전기",Andrew Ng(AI 과학자) 는 인공 지능이 현대 솔루션을 제공하는 데 가져오는 힘을 설명합니다. 그는 빅 데이터의 중요성을 더욱 확신하고 21세기의 "새로운 석유"로 만드는 석유와 그 가치를 나란히 할 것입니다.
진실의 순간:"데이터 전문가는 빅 데이터를 (가치에 따라) 기름으로 간주하고 이를 추출하고 처리하고 기업뿐만 아니라 모든 사람을 만족시키는 통찰력/솔루션으로 변환하는 전문 지식을 개발합니다!"
최근 Google의 Deepmind는 수백만 페타바이트를 처리 하여 성간 연구원의 눈에 숨겨진 2개의 새로운 외계행성을 발견했습니다 . 다양한 스타트업이 세계 최고의 방사선 전문의보다 암을 더 잘 감지하는 이미지 솔루션을 개발 했습니다. 자율 주행 차량이 대중화되고 Google 에서는 모든 언어 를 이해할 수 있는 언어로 실시간 번역 할 수 있는 이어폰을 출시했습니다. 이 모든 혁신은 빅 데이터 덕분에 가능 했습니다.
금융 산업의 빅 데이터 역할 및 급여이제 황금 질문에 답해 보겠습니다.
어떻게 데이터 전문가로 변신할 수 있습니까?
더 나은 데이터 전문가가 되려면 분석가, 데이터 과학자, 데이터 엔지니어 등 빅 데이터의 힘과 잠재력을 이해해야 합니다 . 데이터 전문가 지망생이 빅 데이터 기술로 손을 더럽히는 것이 유리합니다. 하지만 기계 학습 알고리즘에 대한 깊은 이해는 필수입니다!
데이터 도메인의 지식 향상을 정확히 목표로 하는 다음 과정을 자유롭게 검토하십시오.
- BITS Pilani와 함께하는 빅 데이터 엔지니어링 PG 프로그램
- IIIT-Bangalore를 통한 데이터 과학 PG 디플로마
- 기계 학습 및 인공 지능 PG 디플로마
알았다! 내 옵션은 무엇입니까?
빅 데이터 기술에 익숙해지고 Spark, Hive, Hadoop, YARN, HBase 및 Map-Reduce와 같은 도구에 익숙해집니다. 데이터 과학자, 데이터 분석가 또는 데이터 엔지니어로 진행할지 결정할 수 있습니다. 빅 데이터의 힘을 활용하는 거대 기술 기업 및 기타 다국적 기업에서 전 세계적으로 무한한 기회와 고임금 직업을 찾을 수 있습니다.데이터는 새로운 석유라고 불립니다. 매일 분석의 의미를 바꾸고 인공 지능 혁명을 발전시키고 있습니다. 데이터는 우리가 말하는 미래에 활력을 불어넣고 있으며 긴 항해 선박에 탑승하는 것은 좋은 생각입니다.
데이터가 가치 있고 중요한 이유는 무엇입니까?
데이터는 기업 운영의 속도를 높이고 생산 프로세스 및 의사 결정의 오류를 제거하며 위험이 발생하기 전에 감지하고 줄이는 등의 작업에 사용할 수 있습니다. 결과적으로 모든 산업이 데이터를 가치로 전환함으로써 이익을 얻을 수 있습니다. 데이터를 운영의 중심에 두고 이를 통해 모든 작업을 수행하고 사용자에게 권한을 부여하고 조직 전체에서 의사 결정 속도를 높이는 기업이 미래의 승자가 될 것입니다. 그들은 더 적응력 있고 파괴적이며 혁신적이 될 것입니다. 다른 사람들은 그들의 길을 분별하고 그들만의 길을 개척할 때만 그들을 따를 것입니다.
데이터 엔지니어, 데이터 분석가 및 데이터 과학자의 세 가지 주요 데이터 역할은 어떻게 다릅니까?
기업이 데이터를 진지하게 다룰 수 있도록 데이터를 수집, 정리, 분석하는 역할은 다양합니다. 원시 데이터에서 실행 가능한 통찰력에 이르기까지 모든 것을 포함하는 이 프로세스의 광범위한 범위를 감안할 때 각 데이터 작업이 담당하는 것에 대해 약간의 오해가 있을 수 있습니다.
데이터 엔지니어, 데이터 분석가 및 데이터 과학자는 기업이 데이터 팀을 위해 고용하는 세 가지 주요 데이터 역할입니다. 주요 차이점은 다음과 같습니다.
1. 데이터 엔지니어 - 데이터 엔지니어의 임무는 데이터를 수집, 구성 및 보존하는 방법을 파악하는 것이므로 데이터 팀의 중요한 부분입니다. 데이터 엔지니어가 되기 위한 수요 기술은 SQL, Python, AWS, Kafka, Hadoop, 대인 커뮤니케이션, 시간 관리 등입니다.
2. 데이터 분석가 - 훌륭한 데이터 분석가는 여러 관점에서 데이터를 살펴보고 추세를 찾기 위해 데이터를 정리하고 변환하는 호기심과 능력을 가지고 있습니다. 그들은 더 심층적인 연구를 위해 추가 데이터를 수집할 수 있는 위치와 같이 조직이 추구할 새로운 길을 발견할 수 있습니다. 데이터 분석가의 요구 사항은 SQL, 통계 프로그래밍, Microsoft Excel, 비판적 사고, 데이터 시각화, 데이터 프레젠테이션 등입니다.
3. 데이터 과학자 – 데이터 과학자는 비즈니스에 필요한 데이터를 추출하기 위해 알고리즘과 예측 모델을 구성하고 데이터 분석을 지원하고 동료와 결과를 공유합니다. 핵심 데이터 과학 기술은 통계 분석, 기계 학습, 컴퓨터 과학, 프로그래밍, 커뮤니케이션 및 소프트 기술입니다.


