Aprendizado supervisionado versus não supervisionado: diferença entre aprendizado supervisionado e não supervisionado
Publicados: 2020-11-30Índice
Introdução
O aprendizado de máquina é amplamente classificado em três tipos: aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. O aprendizado por reforço ainda é novo e está em rápido desenvolvimento, então vamos ignorar isso neste artigo e mergulhar fundo no aprendizado supervisionado e não supervisionado.
Antes de passar para as definições e usos reais desses dois tipos de aprendizado, vamos primeiro nos familiarizar com o Machine Learning. O aprendizado de máquina é uma aplicação de inteligência artificial que fornece aos sistemas a capacidade de aprender e melhorar automaticamente a partir da experiência sem ser explicitamente programado, esta é apenas a definição do livro de Aprendizado de Máquina, pois este artigo é escrito principalmente para os novatos do campo de Ciência de Dados e Inteligência Artificial deixe-me tornar isso mais claro e interessante para que você possa entender e interpretar melhor.
Consideremos um bebê como nossa máquina e precisamos ajudá-lo a aprender os diferentes números em nosso sistema numérico. Para ajudar o bebê a aprender, precisamos mostrar ao bebê um número diferente e dizer qual é cada número.
Fazer esta parte repetidamente ajuda o bebê a aprender e memorizar os números. Isso nada mais é do que a capacidade de aprender e melhorar automaticamente a partir da experiência sem ser explicitamente programado, ou seja, Machine Learning.
Leia: Ideias de projetos de aprendizado de máquina
Aprendizado Supervisionado
Vamos começar de novo com a definição clássica do livro didático de Aprendizagem Supervisionada e nos familiarizar com o exemplo do bebê que tomamos anteriormente. O aprendizado supervisionado é a tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base em pares de entrada-saída de exemplo. Ele infere uma função de dados de treinamento rotulados que consistem em um conjunto de exemplos de treinamento.

Eu odeio as definições que estão escritas em qualquer livro, pois são tão formais de entender, preferia que um amigo explicasse a definição em seus próprios pensamentos. A longo prazo, sempre que tento lembrar uma definição, eventualmente a explicação dada por um amigo com um exemplo aparece e facilita minha vida. Então, neste artigo deixe-me ser esse amigo para você.
Tomemos novamente o exemplo do bebê que consideramos anteriormente, neste caso, precisamos fazer o bebê aprender e identificar os diferentes frutos que temos. Consideremos a Maçã e a Laranja como nossas duas frutas e começamos mostrando essas duas fotos ao bebê. Também dizemos ao bebê qual foto é qual fruta.
Olhando para essas fotos, o bebê aprende que a fruta será redonda e a fruta de cor vermelha é a maçã e a fruta de cor laranja é a laranja. Agora vamos mostrar ao bebê uma nova foto de Laranja e pedir-lhe para descobrir se a foto é Maçã ou Laranja.
O bebê prevê que a fruta é laranja. O bebê prevê corretamente a fruta como Laranja porque rotulamos as duas frutas como Maçã e Laranja em duas categorias e pedimos ao bebê que aprenda o que é a fruta. É assim que o Aprendizado de Máquina Supervisionado funciona se substituirmos uma máquina por um bebê.
O Aprendizado de Máquina Supervisionado é classificado em dois tipos de problemas conhecidos como Classificação e Regressão.
Classificação
Pelo próprio nome, podemos saber que este é um problema de Machine Learning onde precisamos classificar os dados fornecidos em duas ou mais classes. O exemplo acima que tomamos é um problema de classificação, pois precisamos classificar as imagens fornecidas em uma classe Apple ou Orange.

Quando temos apenas duas classes para classificar nossos dados, isso é chamado de Classificação Binária. Mas em dados do mundo real, tendemos a ter mais de uma classe e isso é chamado de classificação multiclasse. Esses tipos de aprendizado são usados pela maioria para identificar os e-mails de spam, classificar os clientes, verificar se um cliente sai da operadora e muitos outros casos de uso.
Leia também: Carreira em Machine Learning
Regressão
A regressão, por outro lado, lida com dados contínuos, como prever seu salário com base na experiência. Nesse caso, não precisamos colocar os dados em nenhuma classe, mas precisamos prever o valor contínuo com base nos dados contínuos que temos.
Esses tipos de problemas têm colunas contínuas em seu conjunto de dados, enquanto a Classificação tende a ter colunas categóricas. Esses tipos de aprendizado são usados para prever o crescimento financeiro no próximo trimestre para qualquer empresa, notas dos alunos com base em suas notas anteriores e muito mais.
Aprendizado não supervisionado
O aprendizado não supervisionado é um tipo de aprendizado de máquina que procura padrões não detectados anteriormente em um conjunto de dados sem rótulos pré-existentes e com um mínimo de supervisão humana.
Em contraste com o aprendizado supervisionado que geralmente faz uso de dados rotulados por humanos, o aprendizado não supervisionado, também conhecido como auto-organização, permite a modelagem de densidades de probabilidade sobre entradas. Vamos considerar o exemplo do bebê para entender melhor o Aprendizado de Máquina Não Supervisionado.

Vamos usar um grupo de fotos de gatos e cachorros como entrada neste exemplo; nos exemplos anteriores, o bebê sabe que as fotos são de maçã e laranja, conforme as rotulamos e categorizamos.
Nesse caso, o bebê não sabe de nada e, portanto, não pode categorizar qual é um gato e qual é um cachorro. Mas posso dizer que algumas das fotos parecem semelhantes quando comparadas às outras. Nesse caso, não podemos rotular os dados, mas ainda podemos encontrar padrões nos dados. É assim que funciona o Aprendizado de Máquina Não Supervisionado.
Agrupamento
O exemplo acima descreve claramente o problema de clustering, precisamos agrupar nosso conjunto de dados com base nos padrões que encontramos em nossos dados. O clustering é um problema de aprendizado de máquina muito importante e muitas empresas tendem a usar essa técnica para encontrar padrões valiosos, insights de seus dados.
Conclusão
Neste artigo, conhecemos os diferentes tipos de Aprendizado de Máquina, entendemos aqueles com um exemplo fácil de entender, investigamos as divisões adicionais de cada aprendizado. Este artigo aborda apenas o básico dos problemas de Machine Learning, cada tipo de problema possui diferentes tipos de algoritmos de aprendizado de máquina.
Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.