Álgebra linear para aprendizado de máquina: conceitos críticos, por que aprender antes de ML
Publicados: 2020-04-30Aprendizado de máquina, robótica, ciência de dados, inteligência artificial e visão computacional estão entre as áreas que foram fundamentais para levar nossa tecnologia ao nível em que está agora. À medida que você começa a adquirir mais conhecimento sobre essas tecnologias, você se deparará com um conjunto de jargões ou palavras específicas que são comuns a essas tecnologias.
Alguns desses termos incluem regressão de laço, condições KKT, kernel PCA, máquinas de vetor de suporte (SVM), multiplicadores de Lagrange e regressão de cume, entre outros. Agora, esses jargões podem ser inventados apenas para manter os estranhos afastados, mas eles dizem muito sobre sua associação com a álgebra linear típica que conhecemos de nossos dias na escola.
Portanto, torna-se imperativo que todos os indivíduos que estão aprendendo machine learning ou ciência de dados cheguem a um acordo com o que são a álgebra linear e a teoria da otimização. Você também precisa aprender ciência de dados e saber como usá-los ao resolver problemas usando ML ou ao entender melhor os enormes dados disponíveis usando ciência de dados.
Neste blog, vamos nos concentrar em como o aprendizado de máquina e a álgebra linear estão relacionados e como uma melhor compreensão do último pode ajudá-lo a dominar o primeiro.
Existem conceitos no aprendizado de máquina, como SVM e regressão, que você não poderá entender corretamente se não estiver ciente de sua conexão de álgebra linear. Você pode ir sem se aprofundar na álgebra linear e como ela está associada ao aprendizado de máquina se estiver apenas analisando esses conceitos para saber o que eles realmente são e não deseja prosseguir com o estudo.
No entanto, se você planeja se tornar um engenheiro de aprendizado de máquina que treinará máquinas daqui para frente ou fará pesquisas e fará contribuições significativas no campo, precisará se aprofundar. Não há outra alternativa. Ter uma sólida formação em álgebra linear é uma obrigação. Nosso principal objetivo ao escrever este blog é apresentar os fundamentos da álgebra linear, garantindo que apresentamos como eles são usados no aprendizado de máquina. Vamos começar entendendo o que é exatamente a álgebra linear.

Índice
O que é Álgebra Linear?
Em palavras simples, é um ramo da matemática que encontra aplicações significativas em engenharia e ciência. Embora tenha tanta importância e tenha aplicações que vão muito além de nossa imaginação, vemos nossos cientistas ficando para trás quando se trata de ter uma compreensão mais profunda dele. A principal razão por trás disso é porque não é a matemática discreta que encontramos a maioria dos cientistas usando com frequência.
Pertence à parte contínua da matemática, o que a torna menos interessante para cientistas e pessoas que trabalham no domínio da tecnologia. Agora vamos deixar uma coisa bem clara. Se você nem mesmo tem uma compreensão básica de como a álgebra linear funciona, você achará muito difícil aprender e usar vários algoritmos de aprendizado de máquina, incluindo os de aprendizado profundo.
Quando você terminar de entender como o aprendizado de máquina funciona fundamentalmente e como e onde você pode usar seus algoritmos, será necessário dedicar um pouco mais de tempo ao aprendizado de matemática. Isso ajudará você a entender muitas coisas novas sobre algoritmos de aprendizado de máquina que você não sabia anteriormente. Você saberá muito sobre suas limitações, suposições subjacentes e outros enfeites.
Agora você encontrará diferentes áreas da matemática que estuda neste momento para aprender a fazer mais com o aprendizado de máquina. Você pode estudar geometria, álgebra, cálculo e estatística entre outros tópicos; no entanto, você precisa ser sábio aqui e selecionar a área que você acha que realmente vai ajudá-lo a enriquecer sua experiência e fornecer uma base mais firme à medida que avança em sua carreira de aprendizado de máquina. Você pode até pedir a especialistas para ajudá-lo a tomar uma decisão.
A próxima pergunta que você fará a si mesmo agora será como você precisa fazer esse processo de aprendizado. Você não pode estudar álgebra linear do zero. Você terá que escolher tópicos que são usados no aprendizado de máquina de uma forma ou de outra. Na próxima seção, discutiremos alguns desses tópicos de álgebra linear que você pode escolher estudar.
Saiba mais: Os 5 principais modelos de aprendizado de máquina explicados para iniciantes
Conceitos importantes de álgebra linear
É muito importante ter conhecimento suficiente de alguns conceitos de álgebra linear se você quiser entender os conceitos subjacentes ao aprendizado de máquina. Se você não conhece a matemática por trás desses algoritmos avançados de aprendizado de máquina, não pode querer desenvolver um domínio sobre eles. Aqui estão alguns conceitos de álgebra linear que você precisa aprender para saber como o aprendizado de máquina funciona.
1. Vetores e Matriz
Não será errado dizer que esses dois conceitos são indiscutivelmente os dois mais importantes que você precisa aprender, considerando sua estreita fidelidade ao aprendizado de máquina. Os vetores consistem em uma matriz de números, enquanto uma matriz compreende vetores 2-D que geralmente são mencionados em maiúsculas.
Agora vamos ver como eles estão ligados aos algoritmos de aprendizado de máquina. Os vetores são úteis em algoritmos de aprendizado de máquina supervisionados, onde estão presentes na forma de variáveis de destino. Por outro lado, os recursos disponíveis nos dados formam a matriz. Você pode realizar várias operações usando a matriz – conjugado, multiplicação, classificação, transformação e outros. Dois vetores com o mesmo número de elementos e igualdade de forma também podem ser usados para realizar subtração e adição.
2. Matriz Simétrica
A matriz simétrica tem importância tanto na álgebra linear quanto no aprendizado de máquina. Matrizes de álgebra linear são usadas principalmente para transportar funções. Na maioria das vezes, essas funções são simétricas, assim como as matrizes que lhes correspondem. Essas funções e os valores que elas contêm podem ser usados para medir a distância do recurso. Eles também podem ser usados para medir a covariância de recursos. Abaixo estão listadas algumas propriedades de matrizes simétricas:
- Matrizes simétricas e suas inversas são ambas simétricas.
- Todos os valores nos autovalores são números reais. Nenhum número complexo está presente.
- Uma matriz simétrica é formada quando uma matriz é multiplicada por sua transposta.
- Matrizes simétricas também possuem a propriedade de fatoração.
- Para matrizes que possuem colunas linearmente independentes, o resultado quando a matriz é multiplicada por sua transposta é invertível.
3. Autovalores e Autovetor
Autovetores são vetores que mudam apenas por um fator escalar, e não há mudança em sua direção. O autovalor correspondente aos autovetores é a magnitude pela qual eles são dimensionados. Autovalores e autovetores são encontrados nos fundamentos da matemática e da computação. Quando plotamos um vetor em um gráfico XY, ele segue uma direção específica. Quando aplicamos a transformação linear em alguns vetores, vemos que eles não mudam de direção. Esses vetores são muito importantes no aprendizado de máquina.
Autovalores e autovetores são usados para minimizar o ruído de dados. Também podemos usar os dois para melhorar a eficiência das tarefas que são conhecidas por serem computacionalmente intensivas. Eles também podem ser usados para acabar com o overfitting. Existem vários outros cenários também em que autovalores e autovetores se mostram úteis.
É muito difícil visualizar os recursos de dados de som, texto ou imagem. Esses dados geralmente são representados em 3-D. É aqui que os autovalores e autovetores entram em cena. Eles podem ser usados para capturar toda a enorme quantidade que está armazenada em uma matriz. Autovalores e autovetores também são usados no reconhecimento facial.

Leia: Ideias de projetos de aprendizado de máquina para iniciantes
4. Análise de Componentes Principais (PCA)
Há muitas vezes em que a dimensionalidade dificulta as coisas quando se trata de resolver certos problemas de aprendizado de máquina. Nesses problemas, estamos lidando com dados cujas características possuem uma correlação muito alta entre si e estão em uma dimensão maior que a usual.
O problema que surge com essa questão de dimensionalidade é que fica muito difícil entender a influência que cada recurso tem na variável alvo. Isso ocorre porque os recursos com correlação mais alta do que o normal tendem a influenciar o alvo da mesma maneira. Também é muito difícil visualizar dados em uma dimensão superior.
A análise de componentes principais é a solução para esses problemas. Ele ajuda você a reduzir sua dimensão de dados para 2-D ou 3-D. Isso é feito garantindo que nenhuma informação seja perdida devido a mudanças na variação máxima. A matemática por trás do PCA está relacionada à ortogonalidade. O PCA é o melhor método disponível para tornar o modelo menos complexo, reduzindo o número de recursos no conjunto de dados.
No entanto, você deve evitar usá-lo como o passo inicial para eliminar o overfitting. Você deve começar limitando o número de recursos nos dados ou aumentando a quantidade de dados. Você deve então tentar usar a regularização L1 ou L2. Se nada funcionar, só então você deve recorrer ao PCA.
Leia também: As 9 principais bibliotecas de aprendizado de máquina que você deve conhecer
Por que você deve aprender álgebra linear antes do aprendizado de máquina?
1. Álgebra linear é a chave para se destacar em aprendizado de máquina
Não há como negar o fato de que o cálculo supera a álgebra linear quando se trata de matemática avançada. O cálculo integral e diferencial ajuda muito mais do que apenas com integração, diferenciação e limites, eles também servem como conhecimento fundamental necessário para aplicações, como tensores e vetores.
Aprender essas coisas ajudará você a entender melhor as equações lineares e as funções lineares, entre outras áreas. Você também conhecerá conceitos avançados, como o método Simplex e vetores espaciais. Se precisar de ajuda com programação linear, você pode usar o método Simplex. Para melhorar nesses conceitos, comece dando mais tempo à álgebra linear.
2. Previsão de aprendizado de máquina
Quando você aprende álgebra linear, você melhora a consciência ou o instinto que desempenha um papel tão importante no aprendizado de máquina. Agora você será capaz de fornecer mais perspectivas. As matrizes e vetores que você estudou irão ajudá-lo a ampliar seu pensamento e torná-lo mais inabalável. As possibilidades são infinitas. Você pode começar a fazer coisas que os outros ao seu redor acharão muito difíceis de entender. Você pode começar a visualizar e configurar gráficos diferentes. Você pode começar a usar mais parâmetros para diferentes componentes de aprendizado de máquina.
3. A álgebra linear ajuda a criar melhores algoritmos de aprendizado de máquina
Você pode usar seu aprendizado de álgebra linear para criar algoritmos de aprendizado de máquina supervisionados e não supervisionados melhores. Regressão logística, regressão linear, árvores de decisão e máquinas de vetor de suporte (SVM) são alguns algoritmos de aprendizado supervisionado que você pode criar do zero com a ajuda da álgebra linear.
Por outro lado, você também pode usá-lo para algoritmos não supervisionados, incluindo decomposição de valor único (SVD), agrupamento e análise de componentes. A álgebra linear o ajudará a desenvolver uma compreensão mais profunda do projeto de aprendizado de máquina em que você está trabalhando e, assim, lhe dará a flexibilidade de personalizar diferentes parâmetros. Você pode aprender mais sobre regressão linear no aprendizado de máquina.
4. Álgebra linear para melhor processamento gráfico em aprendizado de máquina
Os projetos de aprendizado de máquina fornecem diferentes interpretações gráficas para trabalhar – imagens, áudio, vídeo e detecção de borda. Os algoritmos de aprendizado de máquina têm classificadores que treinam uma parte do conjunto de dados fornecido com base em suas categorias. Outro trabalho dos classificadores é eliminar erros dos dados que já foram treinados.

É neste estágio que a álgebra linear entra para ajudar a calcular esse conjunto de dados complexo e grande. Ele usa técnicas de decomposição de matrizes para processar e lidar com grandes dados para diferentes projetos. Os métodos de decomposição de matrizes mais populares são a decomposição QR e LU.
5. Álgebra linear para melhorar sua visão das estatísticas
As estatísticas são muito importantes para organizar e integrar dados no aprendizado de máquina. Se você quer entender melhor os conceitos estatísticos, primeiro precisa saber como funciona a álgebra linear. A álgebra linear tem métodos, operações e notações que podem ajudar a integrar tópicos estatísticos avançados, como análise multivariada, em seu projeto.
Suponha que você esteja trabalhando em dados de pacientes que incluem peso, altura, pressão arterial e frequência cardíaca. Essas são as múltiplas variáveis do conjunto de dados em que você está trabalhando. Vamos supor aqui que um aumento de peso levará a um aumento na pressão arterial. Não é muito difícil entender que esta é uma relação linear. Portanto, para entender melhor como um aumento em uma variável afeta a outra, você precisará ter um bom entendimento de álgebra linear.
Conclusão
O aprendizado de máquina em si é um tópico bastante vasto; no entanto, existem outros conceitos, como álgebra linear, que são tão importantes para aprender quanto o próprio ML. Aprender álgebra linear e outros tópicos ajudará a entender melhor os conceitos de aprendizado de máquina.
Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.
O que é mais importante para o aprendizado de máquina – cálculo ou álgebra linear?
Se você planeja construir uma carreira em aprendizado de máquina, já deve saber que os fundamentos desse campo estão profundamente na matemática. A matemática do aprendizado de máquina consiste em 3 áreas principais, cálculo, álgebra linear e estatística. Como o aprendizado de máquina envolve muitos vetores e matrizes, a álgebra linear constitui suas partes mais fundamentais. Mas o cálculo também é parte integrante do ML, pois ajuda a entender como o mecanismo de aprendizado de máquina funciona. Portanto, tanto o cálculo quanto a álgebra linear são igualmente importantes. No entanto, quanto de ambos você precisa usar depende principalmente de suas funções e responsabilidades.
A álgebra linear é mais difícil de aprender do que o cálculo?
Álgebra linear é tudo sobre estudar linhas retas usando equações lineares, enquanto cálculo é tudo sobre componentes de variação suave que envolvem derivadas, vetores, integrais, curvas e muito mais. Dito isto, a álgebra linear é muito mais simples de aprender do que o cálculo básico. Na álgebra linear, se você puder entender a teoria por trás dos teoremas da álgebra linear, poderá resolver todas as questões relacionadas. No entanto, isso não é suficiente para resolver problemas de cálculo. Mais do que apenas memorizar algoritmos, ou seja, a parte teórica, você precisa entender os aspectos computacionais para responder questões computacionais em cálculo. O cálculo é a parte mais desafiadora da matemática, enquanto a álgebra linear é mais concreta e menos abstrata; doravante mais fácil de entender.
A estatística é importante no aprendizado de máquina?
Quando se trata de aprendizado de máquina, você não pode deixar as estatísticas de fora. Os especialistas são da opinião de que o aprendizado de máquina é estatística aplicada, por isso é um pré-requisito para quem deseja seguir uma carreira em aprendizado de máquina. Ao projetar modelos de aprendizado de máquina, os dados desempenham um papel fundamentalmente vital. Técnicas estatísticas são necessárias para encontrar respostas baseadas em dados acumulados que serão usados para treinar diferentes modelos de aprendizado de máquina. Portanto, uma familiaridade básica com estatísticas é obrigatória para o aprendizado de máquina.