¿Quieres ser un analista de datos? Aquí están las mejores habilidades y herramientas para dominar
Publicado: 2017-02-16Procesar números y detectar patrones se ha convertido en el estándar de oro en la industria de TI. Los trabajos de analista de datos están en demanda, los trabajos más prometedores de LinkedIn de 2017 incluyeron al ingeniero de datos en el número 9 y al gerente de análisis en el número 18.
Otro estudio de Glassdoor de los 50 mejores trabajos en Estados Unidos coloca al científico de datos en el primer puesto, con el ingeniero de datos en un cercano número 3 y el gerente de análisis en un envidiable número 5. Sin embargo, ocupar el primer puesto no es fácil. Necesita un arsenal de habilidades de análisis de datos si desea registrar un crecimiento año tras año y un paquete de pago abundante con este importante avance profesional.
Mientras que Internet está repleto de recursos gratuitos sobre cómo dominar los fundamentos de la ciencia de datos, el análisis de sentimientos y el aprendizaje automático acelerado, entre otros. Analytics India Magazine y UpGrad lo ayudan a superar las tonterías enumerando 5 habilidades básicas necesarias para convertirse en analista de datos.
¿Qué está interrumpiendo estos 4 roles de Martech? ¡Análisis de datos!Tabla de contenido
Póngase a la cabeza de los trabajos de analista de datos con estas habilidades
Comencemos con algunos conceptos básicos:
Antecedentes educativos

No todo el mundo puede convertirse en analista de datos. Necesita tener una inclinación natural hacia las matemáticas y la estadística . Todos esos años de aprender cálculo y probabilidad serán útiles. Un título en Ciencias de la Computación es siempre una ventaja añadida.
Estadísticas: para convertirse en un analista de datos de pleno derecho, es esencial una base sólida en estadísticas. Ser bueno en estadísticas te ayudará a comprender los algoritmos en profundidad y también cuándo deben usarse.
Repase las estadísticas aplicadas, el álgebra lineal, el análisis real, la teoría de grafos y el análisis numérico. El álgebra lineal entra en juego con la regresión, la comprensión de las estructuras de datos y la preparación de datos para el modelado de datos prescriptivo y predictivo.
¿Cómo puede hacer la transición al análisis de datos?Habilidades en programación
1) Lenguaje estadístico:
SAS vs R vs Python : es una pregunta que molesta a la mayoría de los nerds de datos cuando se trata de elegir la herramienta analítica de su elección. Mientras que SAS (caro) y Python (facturado por el procesamiento de datos a baja escala) son fáciles de aprender, R (lenguaje de programación de bajo nivel) gana sin dudas gracias a su capacidad informática avanzada, mejores capacidades gráficas y herramientas avanzadas.
Dado que R es de código abierto, las características y los paquetes se agregan rápidamente a diferencia de SAS. Otra razón por la que R está prosperando es que tiene un enorme ecosistema que lo respalda y lo mantiene actualizado con características ricas.

Sugerencia profesional : el atractivo comercial de R lo ha convertido en un nombre familiar (léase: empresas enfocadas en TI/tecnología) y aunque las empresas todavía usan ampliamente SAS, este lenguaje estadístico se está poniendo de moda. Pero R tiene una curva de aprendizaje empinada.
2) Idioma de consulta:
SQL: uno de los lenguajes de consulta más antiguos , SQL es un lenguaje de base de datos de propósito general que se utiliza para consultas analíticas y transaccionales. SQL se usa principalmente en las operaciones diarias y no puede admitir petabytes de datos. Los programas como el tutorial de Unity pueden ayudarlo a familiarizarse con PHP y MySQL más a fondo.
Hive : este lenguaje de consulta de Hadoop fue inventado por el equipo de infraestructura de datos de Facebook. Desde el día en que Hive fue de código abierto en 2008, se ha convertido en la opción popular para los analistas de negocios . La solución de almacenamiento de datos de código abierto que utiliza un lenguaje de tipo SQL llamado HQL puede admitir terabytes y petabytes de datos en lugar de SQL. La desventaja es que solo admite datos estructurados.
5 nuevos roles de análisis de datos que definirán el futuro de la banca 
PIG: una de las mayores ventajas de Pig es que puede procesar datos estructurados y no estructurados y funciona sobre MapReduce. Es el lenguaje de referencia para la mayoría de los programadores que tienden a escribir scripts. Lo que debe hacer es aprender Pig Latin que lo ayude a abordar estructurado/no estructurado y semiestructurado con más facilidad en comparación con Hive. Aquí hay un poco de curiosidades históricas: Pig se creó en Yahoo en 2006 para realizar trabajos de MapReduce.
Consejo profesional: el conocimiento de SQL ayudará a elegir Pig and Hive.
3) Lenguaje de secuencias de comandos:
MATLAB: Es un lenguaje utilizado para la minería de datos. Algunos podrían argumentar que su popularidad ha disminuido. No estaría de más ponerlo en tu arsenal. Recuerde, MATLAB existe desde hace mucho, mucho tiempo, se inventó a fines de los años 70 como una herramienta para el análisis de datos.
Python: este es sin duda uno de los lenguajes de secuencias de comandos más populares y su popularidad se deriva de la pila actual. Las bibliotecas principales NumPy, SciPy, Pandas, matplotlib, IPython. Perfecto para modelado y análisis. Sin embargo, tiene un inconveniente: la escalabilidad para grandes conjuntos de datos.


Consejo profesional: Python tiene una comunidad fuerte y se usa mejor para raspar sitios web e ingeniería de datos. ¿Adivina qué? ¡Es tan fácil que las personas sin experiencia en programación también pueden dominarlo!
Aprendizaje automático
Machine Learning (ML) no es solo una palabra de moda. Está encontrando una gran utilidad en todos los dominios y ganando una enorme tracción, por lo que se está convirtiendo en una habilidad esencial que los profesionales de datos deben tener. En ML, la regresión, la clasificación y la segmentación son las áreas de aprendizaje generales en las que los analistas deben centrarse.
¡6 tendencias de análisis de datos a seguir en 2017!Visualización de datos
Tienes todos estos datos; Ahora, ¿cómo le das vida? Su trabajo, como analista de datos, sería hacer informes evocadores, encontrar tendencias y comunicar estos hallazgos a los altos mandos. Las herramientas de visualización de datos para dominar son Tableau, Microsoft Power BI, Oracle Visual Analyser, SAS Visual Analytics. Si le gusta R, puede usar el paquete ggplot para crear tablas y gráficos altamente interactivos.
Consejo profesional : no se limite a aprender las herramientas. Intente comprender también el motivo de la codificación visual de datos.

Una guía para empresas emergentes sobre análisis de datos
Comprender las bases de datos
Esencialmente utilizado para comprender mejor al cliente, el análisis de bases de datos se extiende desde el análisis básico hasta la extracción de datos complejos a través de varias herramientas: Sistema de Información Geográfica (SIG) o análisis de texto. Los pasos básicos para analizar bases de datos son extraer, limpiar, fusionar, analizar e implementar.
Checkout: Salario del analista de datos en la India
Munging de datos o disputa de datos
Antes de comenzar a extraer información de montones de datos, los datos deben limpiarse. En pocas palabras, alguien debe hacer el trabajo de un conserje, lo que significa limpiar manualmente los datos y procesarlos en un formato unificado antes de analizarlos. Hasta ahora, Excel se ha utilizado para limpiar y enriquecer datos, pero Stanford presentó una herramienta interactiva, un trabajo en progreso llamado Wrangler.
Consejo profesional: pruebe Wrangler y vea cómo puede manipular datos del mundo real y exportarlos para usarlos en Tableau o R

Un analista de datos no requiere habilidades avanzadas como los científicos de datos. Sin embargo, dado que estos roles son multifacéticos y el aprendizaje es un proceso continuo, con recursos adicionales también puede convertirse en un científico de datos junior.
Esencialmente, las matemáticas y las estadísticas (32 %), la informática (19 %) y la ingeniería (16 %) son predominantemente los campos de estudio más importantes para un científico de datos. Por lo general, se espera que los analistas de datos dominen lenguajes como SAS y/o R.
¿Cómo puedo duplicar mi salario? El análisis de datos es su respuestaEs recomendable que las personas con experiencia en informática conozcan la codificación de Python, Hadoop y SQL. Además, trabajar con datos no estructurados es una parte integral del trabajo del analista de datos. Es una buena idea estar acostumbrado a las bases de datos no estructuradas. Además, un analista de datos debe imbuirse de cualidades tales como desarrollar una perspicacia comercial o buenas habilidades de comunicación/presentación, ya que estas habilidades lo ayudarán a mantenerse a la vanguardia.
Aprenda cursos de ciencia de datos en línea de las mejores universidades del mundo. Obtenga programas Executive PG, programas de certificados avanzados o programas de maestría para acelerar su carrera.
Esta publicación se publicó originalmente en la revista Analytics India.
¿Cuál es el lenguaje de codificación preferido para Data Analytics?
Python es el lenguaje de programación de análisis de datos más utilizado del mundo. Es un lenguaje de programación de código abierto y fácil de usar que existe desde hace un año. También es uno de los lenguajes de programación disponibles más convenientes debido a su sintaxis simple y ausencia de complicaciones, lo que ayuda a concentrarse en el lenguaje natural. Los scripts de Python pueden crearse y ejecutarse considerablemente más rápido que otros lenguajes de programación debido a su facilidad de comprensión y uso.
¿Cuáles son los temas matemáticos necesarios para el análisis de datos?
El conocimiento de la aritmética fundamental es muy importante para los principiantes en la ciencia de datos de otros campos. Necesitará una sólida comprensión de las matemáticas, así como la capacidad de combinar figuras de manera confiable para crear nuevas medidas. Para cumplir con las demandas comerciales típicas, como el interés compuesto o la depreciación, un analista de datos también debe estar familiarizado con las estadísticas y las matemáticas. Estadística y probabilidad, álgebra (básica y lineal), cálculo y matemáticas discretas son las cuatro disciplinas matemáticas fundamentales para un analista de datos.
¿Vale la pena aprender Data Analytics?
El análisis de datos puede requerir una comprensión previa de algunas áreas, como lenguajes de programación como R, Python y otros, y conceptos matemáticos y estadísticos. Estos temas, sin embargo, se pueden estudiar con Data Analytics. Puede adquirir una amplia gama de oportunidades de empleo al dominar el análisis de datos, incluidos los analistas comerciales, los científicos de datos y los analistas de datos. Estos trabajos también pagan bien y ofrecen oportunidades más significativas para el progreso. Estas ocupaciones se ocupan de reorganizar los datos de manera que tanto las personas como los robots puedan entenderlos.
