Como funciona o aprendizado de máquina - um guia fácil
Publicados: 2019-07-31A Netflix e a Amazon ficaram ótimas em seu jogo – elas sempre parecem saber qual conteúdo ou produto você adoraria ver/comprar. Você não adora ver tudo já com curadoria ao seu gosto e preferência?
Embora a maioria de nós conheça o segredo por trás do engenhoso Mecanismo de Recomendação da Netflix e da Amazon (Machine Learning, é claro!), quantos de nós estão familiarizados com os mecanismos internos do Machine Learning?
Para esclarecer – Como funciona o Machine Learning ?
Em essência, Machine Learning é uma técnica de análise de dados (um subconjunto de IA) que visa “aprender” com a experiência e permitir que as máquinas executem tarefas que exigem inteligência. Os algoritmos de aprendizado de máquina aplicam métodos computacionais para extrair informações e aprender diretamente dos dados sem serem explicitamente programados para isso (não precisando depender de uma equação predeterminada).
A anatomia dos sistemas de aprendizado de máquina
Todos os sistemas de ML podem ser desintegrados em três partes:

- Modelo – o componente que trata das identificações, ou seja, das previsões.
- Parâmetros – refere-se aos fatores utilizados pelo modelo para chegar às suas decisões (previsões).
- Aprendiz – o componente que ajusta os parâmetros (e como um todo, o modelo) considerando as diferenças nas previsões em relação ao resultado real.
Tipos de aprendizado de máquina
Agora que você está familiarizado com os principais componentes dos sistemas de ML, é hora de dar uma olhada nas diferentes maneiras pelas quais eles “aprendem”.
Aprendizado Supervisionado
Na Aprendizagem Supervisionada, um modelo é explicitamente treinado sobre como mapear a entrada para a saída. Um algoritmo de aprendizado supervisionado usa um conjunto reconhecido de dados de entrada junto com respostas conhecidas (saída) para esses dados e treina o modelo para gerar previsões razoáveis em resposta a novos dados de entrada.
O aprendizado supervisionado usa duas abordagens para desenvolver modelos preditivos –
- Classificação – Como o nome sugere, esta técnica classifica os dados de entrada em diferentes categorias, rotulando-os. É usado para prever respostas discretas (por exemplo, se uma célula cancerosa é benigna ou maligna). Imagens médicas, reconhecimento de fala e pontuação de crédito são três casos de uso populares de classificação.
- Regressão – Esta técnica é usada para prever respostas contínuas, identificando os padrões nos dados de entrada. Por exemplo, flutuações de temperatura ou clima. A regressão é usada para prever o clima, carga de eletricidade e negociação algorítmica.
Aprendizado não supervisionado
A abordagem de aprendizado não supervisionado usa dados não rotulados e busca desvendar os padrões ocultos dentro deles. Assim, a técnica extrai inferências de conjuntos de dados que consistem em dados de entrada desprovidos de respostas rotuladas.
- Clustering – Um dos métodos de aprendizado não supervisionados mais comuns, o clustering é uma técnica de análise de dados exploratória que categoriza dados em “clusters” sem nenhuma informação conhecida sobre as credenciais do cluster. Reconhecimento de objetos e análise de sequência de genes são dois exemplos de agrupamento.
- Redução de Dimensionalidade – A Redução de Dimensionalidade limpa os dados de entrada de todas as informações redundantes e retém apenas as partes essenciais. Assim, os dados não apenas ficam limpos, mas também reduzem de tamanho, ocupando menos espaço de armazenamento.
Aprendizado por Reforço
A Aprendizagem por Reforço visa construir modelos autossustentáveis e de autoaprendizagem que possam aprender e melhorar por meio de tentativa e erro. No processo de aprendizado (treinamento), se o algoritmo puder realizar ações específicas com sucesso, os sinais de recompensa serão acionados. Os sinais de recompensa funcionam como luzes guias para os algoritmos. Existem dois sinais de recompensa:

- Um sinal positivo é acionado para encorajar e continuar uma determinada sequência de ação.
- Um sinal negativo é uma penalidade por uma ação errada em particular. Exige a correção do erro antes de prosseguir no processo de treinamento.
O Aprendizado por Reforço é amplamente utilizado em videogames. É também o mecanismo por trás dos carros autônomos.
Por dentro da função de 'aprendizagem' dos algoritmos de ML
Por trás do funcionamento dos algoritmos de ML e como eles aprendem através da experiência, existem três princípios comuns.
Aprendendo uma função
O primeiro passo no processo de aprendizagem é onde os algoritmos de ML aprendem sobre a função alvo (f) que melhor mapeia a variável de entrada (X) para a variável de saída (Y). Assim,
Y = f(X).
Aqui, a forma da função alvo (f) é desconhecida, daí a modelagem preditiva.
Nesta fase geral de aprendizado, o algoritmo de ML aprende a fazer previsões futuras (Y) com base nas novas variáveis de entrada (X). Naturalmente, o processo não está livre de erros. Aqui o erro (e) existe independente dos dados de entrada (X). Assim,
Y = f(X) + e
Como o erro (e) pode não ter atributos suficientes para caracterizar melhor o cenário de mapeamento de X para Y, ele é chamado de erro irredutível – independentemente de quão bom o algoritmo seja em estimar a função alvo (f), você não pode reduzir o erro ( e).
Fazendo previsões e aprendendo como melhorá-las
No ponto anterior, entendemos como um algoritmo de ML aprende uma função de destino (f). E já sabemos que nosso único e único objetivo aqui é encontrar a melhor maneira possível de mapear Y a partir de X. Em outras palavras, precisamos encontrar a maneira mais precisa de mapear a entrada para a saída.
Haverá erros (e), sim, mas o algoritmo tem que ficar tentando entender a que distância está da saída desejada (Y) e como alcançá-la. Nesse processo, ele ajustará continuamente os parâmetros ou os valores de entrada (X) para melhor corresponder à saída (Y). Isso continuará até atingir um alto grau de semelhança e precisão com o modelo de saída desejado.
Como aprender Machine Learning – passo a passoA abordagem de aprendizagem 'Gradient Descent'
Pode ser verdade que fomos bem sucedidos na criação de máquinas 'inteligentes', mas seu ritmo de aprendizado é diferente – as máquinas tendem a ir devagar. Eles acreditam no processo de aprendizado da “descida do gradiente” – você não dá o salto de uma vez, mas dá pequenos passos e desce lentamente do topo (a metáfora aqui é a de descer uma montanha).

Ao descer uma montanha, você não pula, corre ou se arremessa para baixo de uma só vez; em vez disso, você toma medidas medidas e calculadas para chegar ao fundo com segurança e evitar contratempos.
Os algoritmos de ML usam essa abordagem – eles continuam se ajustando aos parâmetros em mudança (imagine novamente o terreno acidentado e inexplorado de uma montanha) para obter o resultado desejado finalmente.
Concluir…
O objetivo fundamental de todos os algoritmos de Machine Learning é desenvolver um modelo preditivo que melhor generalize para dados de entrada específicos. Como os algoritmos e sistemas de ML são treinados por meio de diferentes tipos de entradas/variáveis/parâmetros, é imperativo ter um vasto conjunto de dados. Isso permite que os algoritmos de ML interajam com diferentes tipos de dados para aprender seu comportamento e produzir os resultados desejados.
Esperamos que com este post possamos desmistificar o funcionamento do Machine Learning para você!