Principais etapas para dominar a ciência de dados, confie em mim, eu tentei
Publicados: 2017-10-10Thulasiram recebeu seu PG Diploma in Data Analytics da UpGrad e IIIT-Bangalore e agora trabalha na UpGrad como Program Associate for Data Analysis na UpGrad .
Anos atrás, li uma história no livro O monge que vendeu sua Ferrari , uma história que me lembro até hoje.
Era uma vez um professor famoso por suas habilidades de tiro com arco. Dizia-se que a flecha do professor nunca erraria o alvo. Suas habilidades atraíram muitos estudantes. Um dia, o professor pediu a um de seus alunos que o vendasse. Então, ele pediu ao aluno que montasse um alvo e lhe entregasse seu arco e flecha. Todos os alunos prenderam a respiração e observaram o professor. Em seus corações, eles tinham certeza de que a flecha do professor atingiria o alvo. Como todos estavam assistindo com a respiração suspensa, a flecha do professor saiu do arco e errou o alvo! Os alunos ficaram boquiabertos. Um dos alunos tirou a venda do mestre e perguntou: “Como você pode errar o alvo?” O mestre respondeu –
“Não se pode acertar um alvo que não se vê!”

Há muito tempo, participei de um evento de formação de professores. Em uma das palestras, fomos informados de que deveríamos informar antecipadamente os alunos sobre o que eles aprenderão em uma determinada sessão, pois isso os ajudará a se preparar melhor para o que está por vir. A aprendizagem ocorre melhor quando os alunos sabem por que estão aprendendo o que estão aprendendo e como isso pode ser utilizado. O contexto ajuda a facilitar o aprendizado. No processo de tentar resolver um problema difícil de maneira criativa, o aprendizado ocorre naturalmente e o que aprendemos fica conosco.
Como podemos aplicar esses princípios gerais à ciência de dados? O primeiro passo para dominar a ciência de dados é ter uma meta mensurável. Você deve ter paixão e amor por dados. No Digi-verso de hoje, é fácil se perder ou se distrair. Equilibrar trabalho, família e aprendizado torna tudo ainda mais complicado. Portanto, é crucial definir uma meta de aprendizado e segui-la meticulosamente.
Um guia de inicialização para análise de dados
Em segundo lugar, a prática é uma obrigação para dominar qualquer habilidade. No livro Outliers , Malcolm Gladwell afirma que são necessárias 10.000 horas para dominar uma habilidade. Há um pouco de controvérsia em torno desse número, mas uma coisa é clara: sem prática, o domínio de qualquer habilidade não pode ser alcançado. A ciência de dados não é exceção. A melhor abordagem é trabalhar em um problema com o qual você se importa, um que o inspire. Aprender por aprender não durará muito, e a teoria será esquecida ao longo do caminho.
Recentemente, li um artigo sobre um estudante que ajudou a resolver o problema de detectar câncer de olho analisando imagens publicamente disponíveis. Ela aprendeu tudo o que era necessário para resolver o problema no caminho e conseguiu algo grandioso. A ciência de dados, por definição, é um assunto interdisciplinar. Envolve álgebra linear, programação, estatística, infraestrutura de computadores e muitas outras áreas. Essa longa lista é intimidante para todos nós que gostariam de passar pelos portões da ciência de dados.
Portanto, será bom focar inicialmente em dois ou três algoritmos e tentar aplicá-los aos problemas que você escolher. Em vez de aprender um pouco sobre todos os algoritmos sob o sol, explore alguns em profundidade. Atualmente, os recursos em nosso mundo são muito menores e a demanda por eles é muito alta. Usar a ciência de dados de maneira otimizada pode nos ajudar a encontrar maneiras de utilizar melhor esses recursos escassos.
Além disso, tente experimentar quando estiver trabalhando em um problema. Existem várias maneiras de prosseguir, e você só saberá a correta depois de tentar. Os experimentos o deixarão pronto para executar tarefas de ciência de dados, como melhorar a precisão de algoritmos, reduzir o tempo necessário para execução, paralelizar a execução, preparar o modelo para produção etc. Em muitas das entrevistas de emprego que dei, um A pergunta era sobre os conjuntos de dados que eu havia tratado ou os problemas do mundo real que eu havia resolvido. Trabalhar em um problema certamente será um grande trunfo em sua busca por emprego. 
A comunicação dos resultados é tão importante quanto a própria análise. A ciência de dados tem tudo a ver com contar histórias. Em outra entrevista, me perguntaram:

“Como você vai explicar a mediana para sua avó?”
Eu tive que improvisar para explicar o jargão complexo em palavras simplificadas. Em uma organização, a administração muitas vezes não estará ciente do jargão, e a comunicação simples e eficaz será fundamental. Tente explicar conceitos de ciência de dados para crianças (ou avós!) e veja se eles entendem.
Salários de Cientistas e Analistas de Dados
Por fim, tudo se resume a visibilidade e presença. Como aspirante a cientista de dados, é crucial melhorar sua visibilidade digital. Crie uma conta no GitHub e carregue todos os seus projetos para apresentação. Contribuir para blogs sobre ciência de dados. Participe de grupos de ciência de dados e contribua para as discussões em andamento. Tente responder a perguntas no Quora, Reddit e outros fóruns populares.
Estas são algumas das minhas meditações sobre o longo caminho para o domínio da ciência de dados. Você definitivamente terá outras idéias ou sugestões. Por favor, compartilhe seus pensamentos, artigos, vídeos e podcasts, ou qualquer outra coisa que você sinta que será útil para seus colegas enquanto eles percorrem esse caminho árduo, mas emocionante e extremamente gratificante com você!
Qual é o papel de um Cientista de Dados?
Os cientistas de dados trabalham em vários setores, em parceria com outros para desenvolver algoritmos que podem organizar e recuperar grandes quantidades de dados. Esses dados são utilizados para examinar as ações passadas da empresa, formular estratégias e fazer planos futuros. Além disso, os cientistas de dados trabalham com várias partes interessadas em uma organização ou empresa para recomendar o melhor curso de ação com base em seus dados. Eles são responsáveis por explicar jargões tecnológicos complicados, como aprendizado de máquina, big data e modelagem matemática para profissionais não técnicos.
Quais são as habilidades necessárias para seguir uma carreira em Ciência de Dados?
A Ciência de Dados é inegavelmente uma das profissões que mais rapidamente se expande em termos de perspectivas de emprego. Data Science é usado em uma variedade de aplicações, desde simples previsão de vendas até automóveis autônomos e assistentes pessoais. Não é surpresa que um Cientista de Dados habilidoso esteja em alta demanda. Assim, para dominar a Ciência de Dados é preciso adquirir algumas habilidades técnicas e não técnicas como programação Python e R, Hadoop, Bancos de Dados SQL, Machine Learning e IA, Visualização de Dados, Estratégias de Negócios, Comunicação, Storytelling, Perspicácia nos Negócios, etc.
Qual é a importância da Ciência de Dados?
Em primeiro lugar, empresas e organizações podem transformar uma grande quantidade de dados brutos e não estruturados em insights relevantes com a ajuda da tecnologia de ciência de dados. Em segundo lugar, seja uma grande empresa ou uma start-up, a ciência de dados está se tornando cada vez mais popular. Para uma melhor experiência do cliente, empresas como Google, Amazon, Netflix e outras que lidam com muitos dados usam algoritmos de ciência de dados. Por fim, a ciência de dados está auxiliando na automação do transporte, como o desenvolvimento de um automóvel autônomo, que é o modo de transporte do futuro. Além disso, diferentes pesquisas, eleições, confirmação de passagens aéreas e outras previsões podem se beneficiar da ciência de dados.
