4 Tipos de Dados: Nominal, Ordinal, Discreto, Contínuo
Publicados: 2020-12-01Índice
Introdução
A ciência de dados trata de experimentar com dados brutos ou estruturados. Os dados são o combustível que pode levar uma empresa ao caminho certo ou, pelo menos, fornecer insights acionáveis que podem ajudar a criar estratégias para as campanhas atuais, organizar facilmente o lançamento de novos produtos ou experimentar diferentes experimentos.
Todas essas coisas têm um componente de condução comum e este é o Data. Estamos entrando na era digital onde produzimos muitos dados. Por exemplo, uma empresa como a Flipkart produz mais de 2 TB de dados diariamente.
Quando esses dados têm tanta importância em nossa vida, torna-se importante armazená-los e processá-los adequadamente sem nenhum erro. Ao lidar com conjuntos de dados, a categoria de dados desempenha um papel importante para determinar qual estratégia de pré-processamento funcionaria para um determinado conjunto para obter os resultados corretos ou qual tipo de análise estatística deve ser aplicada para obter os melhores resultados. Vamos mergulhar em algumas das categorias de dados comumente usadas.
Tipo de dados qualitativos
Dados qualitativos ou categóricos descrevem o objeto em consideração usando um conjunto finito de classes discretas. Isso significa que esse tipo de dado não pode ser contado ou medido facilmente usando números e, portanto, dividido em categorias. O gênero de uma pessoa (masculino, feminino ou outros) é um bom exemplo desse tipo de dados.
Estes são geralmente extraídos de áudio, imagens ou mídia de texto. Outro exemplo pode ser uma marca de smartphone que fornece informações sobre a classificação atual, a cor do telefone, a categoria do telefone e assim por diante. Todas essas informações podem ser categorizadas como dados qualitativos. Existem duas subcategorias abaixo disso:
Nominal
Estes são o conjunto de valores que não possuem uma ordenação natural. Vamos entender isso com alguns exemplos. A cor de um smartphone pode ser considerada como um tipo de dado nominal, pois não podemos comparar uma cor com outras.
Não é possível afirmar que 'Vermelho' é maior que 'Azul'. O gênero de uma pessoa é outro onde não podemos diferenciar entre masculino, feminino ou outros. As categorias de telefones celulares, seja de médio porte, segmento de orçamento ou smartphone premium, também são tipos de dados nominais.
Leia: Carreira em Ciência de Dados
Ordinal
Esses tipos de valores têm uma ordenação natural, mantendo sua classe de valores. Se considerarmos o tamanho de uma marca de roupas, podemos classificá-las facilmente de acordo com seu crachá na ordem de pequeno < médio < grande. O sistema de classificação ao marcar candidatos em um teste também pode ser considerado como um tipo de dado ordinal onde A+ é definitivamente melhor que a nota B.
Essas categorias nos ajudam a decidir qual estratégia de codificação pode ser aplicada a qual tipo de dados. A codificação de dados para dados qualitativos é importante porque os modelos de aprendizado de máquina não podem manipular esses valores diretamente e precisam ser convertidos em tipos numéricos, pois os modelos são de natureza matemática.
Para o tipo de dado nominal onde não há comparação entre as categorias, pode ser aplicada a codificação one-hot que é semelhante à codificação binária considerando que existem em menor número e para o tipo de dado ordinal pode ser aplicada a codificação de rótulo que é uma forma de inteiro codificação.
Tipo de dados quantitativos
Esse tipo de dado tenta quantificar coisas e o faz considerando valores numéricos que os tornam contáveis por natureza. O preço de um smartphone, o desconto oferecido, o número de avaliações de um produto, a frequência do processador de um smartphone ou a memória RAM desse telefone específico, tudo isso se enquadra na categoria de tipos de dados quantitativos.
O principal é que pode haver um número infinito de valores que um recurso pode assumir. Por exemplo, o preço de um smartphone pode variar de x a qualquer valor e pode ser dividido ainda mais com base em valores fracionários. As duas subcategorias que os descrevem claramente são:
Discreto
Os valores numéricos que se enquadram são números inteiros ou números inteiros são colocados nesta categoria. O número de alto-falantes no telefone, câmeras, núcleos no processador, o número de sims suportados todos esses são alguns exemplos do tipo de dados discreto.

Contínuo
Os números fracionários são considerados como valores contínuos. Estes podem assumir a forma de frequência de operação dos processadores, a versão Android do telefone, frequência de wifi, temperatura dos núcleos e assim por diante.
Deve ler: Salário de cientista de dados na Índia
Os tipos Ordinal e Discreto podem se sobrepor?
Se você prestar atenção nisso, você pode dar numeração às classes ordinais, e então deve ser chamado de tipo discreto ou ordinal? A verdade é que ainda é ordinal. A razão para isso é que mesmo que a numeração seja feita, ela não transmite as distâncias reais entre as classes.
Por exemplo, considere o sistema de classificação de um teste. As respectivas notas podem ser A, B, C, D, E, e se as numerarmos desde o início, seria 1,2,3,4,5. Agora, de acordo com as diferenças numéricas, a distância entre o grau E e o grau D é a mesma que a distância entre o grau D e C, o que não é muito preciso, pois todos sabemos que o grau C ainda é aceitável em comparação com o grau E, mas o meio diferença os declara iguais.
Você também pode aplicar a mesma técnica a um formulário de pesquisa em que a experiência do usuário é registrada em uma escala de muito ruim a muito boa. As diferenças entre as várias classes não são claras, portanto, não podem ser quantificadas diretamente.
Testes Diferentes
Discutimos todas as principais classificações de dados. Isso é importante porque agora podemos priorizar os testes a serem realizados em diferentes categorias. Agora faz sentido traçar um histograma ou gráfico de frequência para dados quantitativos e um gráfico de pizza e gráfico de barras para dados qualitativos.
A análise de regressão, onde se analisa a relação entre uma variável dependente e duas ou mais variáveis independentes, só é possível para dados quantitativos. O teste ANOVA (Análise de variância) é aplicável apenas em variáveis qualitativas, embora você possa aplicar o teste ANOVA de duas vias que usa uma variável de medição e duas variáveis nominais.
Dessa forma, você pode aplicar o teste Qui-quadrado em dados qualitativos para descobrir relações entre variáveis categóricas.
Conclusão
Neste artigo, discutimos como os dados que produzimos podem virar as tabelas de cabeça para baixo, como as várias categorias de dados são organizadas de acordo com sua necessidade. Também analisamos como os tipos de dados ordinais podem se sobrepor aos tipos de dados discretos.
Que tipo de gráfico é adequado para qual categoria de dados também foi discutido junto com vários tipos de teste que podem ser aplicados em tipos de dados específicos e outros testes que usam todos os tipos de dados.
Se você está curioso para aprender ciência de dados para estar na frente dos avanços tecnológicos em ritmo acelerado, confira a Certificação Avançada em Ciência de Dados do upGrad & IIIT-B
Por que a ciência de dados é importante?
A importância da ciência de dados reside no fato de que ela reúne conhecimentos de domínio em programação, matemática e estatística para gerar novos insights e dar sentido a grandes quantidades de dados. Para as empresas, a ciência de dados é um recurso significativo para a tomada de decisões orientadas por dados, pois descreve a coleta, o salvamento, a classificação e a avaliação de dados. Especialistas em computação altamente experientes freqüentemente o empregam. Quando nos perguntamos por que a ciência de dados é essencial, a resposta é porque o valor dos dados continua a aumentar. A ciência de dados está em grande demanda porque demonstra como os dados digitais alteram as organizações e permitem que elas façam escolhas mais informadas e essenciais.
Qual é o escopo da ciência de dados?
A ciência de dados pode ser encontrada em qualquer lugar nos dias de hoje. Isso inclui transações online como compras na Amazon, feeds de mídia social como Facebook/Instagram, recomendações da Netflix e até os recursos de reconhecimento facial e digital fornecidos pelos smartphones. A Ciência de Dados abrange inúmeras ideias tecnológicas de ponta, como Inteligência Artificial, Internet das Coisas (IoT) e Deep Learning, para citar algumas. O efeito da ciência de dados cresceu dramaticamente devido aos seus avanços e avanços técnicos, expandindo seu escopo. Ao aprender Ciência de dados, você pode escolher seu perfil de trabalho entre muitas opções, e a maioria desses trabalhos é bem remunerada. Alguns desses perfis de trabalho são Analista de Dados, Cientista de Dados, Engenheiro de Dados, Cientista e Engenheiro de Machine Learning, Desenvolvedor de Business Intelligence, Arquiteto de Dados, Estatístico, etc.
Como os dados nominais são diferentes dos dados ordinais?
Os dados nominais incluem nomes ou características que contêm duas ou mais categorias, e as categorias não possuem ordenação inerente. Em outras palavras, esses tipos de dados não têm nenhuma classificação ou ordem natural. Um tipo de dados ordinal é semelhante a um nominal, mas a distinção entre os dois é uma ordem óbvia nos dados. No geral, os dados ordinais têm alguma ordem, mas os dados nominais não. Todos os dados de classificação, como as escalas Likert, as escalas de fezes de Bristol e quaisquer outras escalas classificadas entre 0 e 10, podem ser expressos usando dados ordinais.