기계 학습을 위한 선형 대수학: 중요 개념, ML 전에 배워야 하는 이유

게시 됨: 2020-04-30

기계 학습, 로봇 공학, 데이터 과학, 인공 지능 및 컴퓨터 비전은 우리 기술을 현재 수준으로 끌어올리는 데 중요한 역할을 한 분야에 속합니다. 이러한 기술에 대한 더 많은 지식을 습득하기 시작하면서 이러한 기술에 공통적인 전문 용어 또는 특정 단어를 접하게 될 것입니다.

이러한 용어 중 일부는 올가미 회귀, KKT 조건, 커널 PCA, 지원 벡터 머신(SVM), 라그랑주 승수 및 능선 회귀를 포함합니다. 이제 이러한 전문 용어는 외부인이 접근하지 못하도록 하기 위해 만들어졌을지 모르지만 학교에서 우리가 알고 있는 전형적인 선형 대수학과의 연관성에 대해 많은 것을 말해줍니다.

따라서 기계 학습 또는 데이터 과학을 배우는 모든 개인은 선형 대수 및 최적화 이론이 무엇인지 먼저 이해하는 것이 필수적입니다. 또한 데이터 과학을 배우고 ML을 사용하여 문제를 해결할 때 또는 데이터 과학을 사용하여 사용할 수 있는 방대한 데이터를 더 이해할 때 데이터 과학을 사용하는 방법을 알아야 합니다.

이 블로그에서는 기계 학습과 선형 대수학이 어떻게 관련되어 있고 후자를 더 잘 이해하면 전자를 마스터하는 데 어떻게 도움이 되는지에 초점을 맞출 것입니다.

SVM 및 회귀와 같은 기계 학습에는 선형 대수 연결을 인식하지 못하면 제대로 이해할 수 없는 개념이 있습니다. 선형 대수학에 대해 깊이 들어가지 않고 머신 러닝과 관련이 있는 방법을 살펴보고 이러한 개념이 실제로 무엇인지 알고 더 이상 연구를 추구할 생각이 없다면 진행할 수 있습니다.

그러나 앞으로 기계를 훈련시키거나 연구를 수행하고 현장에서 지대한 공헌을 할 기계 학습 엔지니어가 될 계획이라면 깊이 파고들어야 합니다. 다른 대안은 없습니다. 선형 대수학에 대한 확고한 배경이 있어야 합니다. 이 블로그를 작성하는 우리의 주요 목표는 선형 대수학의 기초를 머신 러닝에서 사용하는 방법을 제시하는 것입니다. 선형 대수가 정확히 무엇인지 이해하는 것으로 시작하겠습니다.

목차

선형 대수학이란 무엇입니까?

간단히 말해서, 공학 및 과학에서 중요한 응용 프로그램을 찾는 수학의 한 분야입니다. 그것이 그렇게 중요하고 우리의 상상을 훨씬 뛰어 넘는 응용 프로그램을 가지고 있지만, 우리는 과학자들이 그것에 대한 더 깊은 이해에 관해서는 뒤처지는 것을 봅니다. 이것의 주된 이유는 대부분의 과학자들이 자주 사용하는 이산 수학이 아니기 때문입니다.

그것은 수학의 연속적인 부분에 속하므로 기술 영역에서 일하는 과학자와 사람들에게 덜 흥미롭습니다. 이제 한 가지를 분명히 합시다. 선형 대수학이 어떻게 작동하는지에 대한 기본적인 이해가 없다면 딥 러닝 알고리즘을 비롯한 여러 머신 러닝 알고리즘을 배우고 사용하는 것이 매우 어렵다는 것을 알게 될 것입니다.

기계 학습이 기본적으로 작동하는 방식과 해당 알고리즘을 사용할 수 있는 방법 및 위치를 완료하면 수학 학습에 조금 더 시간을 할애해야 합니다. 이것은 이전에 이해하지 못했던 기계 학습 알고리즘에 대한 많은 새로운 사실을 이해하는 데 도움이 될 것입니다. 그들의 한계, 기본 가정 및 기타 등등에 대해 많이 알게 될 것입니다.

이제 이 시점에서 기계 학습으로 더 많은 작업을 수행하는 방법을 배우기 위해 공부하는 수학의 다양한 영역을 접하게 될 것입니다. 기하학, 대수학, 미적분학, 통계학 등을 공부할 수 있습니다. 그러나 여기에서 현명해야 하며 경험을 풍부하게 하고 기계 학습 경력에서 앞서 나갈 때 보다 확고한 기반을 제공하는 데 실제로 도움이 될 것이라고 생각하는 영역을 선택해야 합니다. 전문가에게 결정을 내리는 데 도움을 요청할 수도 있습니다.

당신이 지금 스스로에게 던지게 될 다음 질문은 이 학습 과정을 어떻게 진행해야 할 필요가 있을 것입니다. 선형 대수학은 처음부터 공부할 수 없습니다. 어떤 방식으로든 기계 학습에 사용되는 주제를 선택하고 선택해야 합니다. 다음 섹션에서는 공부하기로 선택할 수 있는 몇 가지 선형 대수학 주제에 대해 논의할 것입니다.

더 알아보기: 초보자를 위한 상위 5가지 머신 러닝 모델 설명

중요한 선형 대수학 개념

기계 학습의 기본 개념을 이해하려는 경우 몇 가지 선형 대수 개념에 대한 충분한 지식을 갖는 것이 매우 중요합니다. 이러한 고급 기계 학습 알고리즘의 이면에 있는 수학을 모른다면 이 알고리즘에 대한 숙달을 개발하고 싶지 않을 것입니다. 다음은 기계 학습이 어떻게 작동하는지 알기 위해 배워야 할 선형 대수학의 몇 가지 개념입니다.

1. 벡터와 행렬

이 두 개념은 틀림없이 기계 학습에 대한 긴밀한 충성도를 고려하여 배워야 할 가장 중요한 두 개념이라고 말하는 것이 잘못된 것은 아닙니다. 벡터는 숫자 배열로 구성되는 반면 행렬은 일반적으로 대문자로 언급되는 2차원 벡터로 구성됩니다.

이제 그것들이 기계 학습 알고리즘과 어떻게 연결되는지 봅시다. 벡터는 대상 변수의 형태로 존재하는 지도 머신 러닝 알고리즘에 유용합니다. 반면에 데이터에서 사용할 수 있는 기능은 행렬을 형성합니다. 켤레, 곱셈, 순위, 변환 등 행렬을 사용하여 여러 연산을 수행할 수 있습니다. 동일한 수의 요소와 모양이 동일한 두 벡터를 사용하여 뺄셈과 덧셈을 수행할 수도 있습니다.

2. 대칭 행렬

대칭 행렬은 선형 대수와 기계 학습 모두에서 중요합니다. 선형 대수학 행렬은 주로 함수를 전달하는 데 사용됩니다. 대부분의 경우 이러한 함수는 대칭이며 이에 대응하는 행렬도 마찬가지입니다. 이러한 기능과 해당 기능이 보유한 값은 특징 거리를 측정하는 데 사용할 수 있습니다. 특성 공분산을 측정하는 데 사용할 수도 있습니다. 다음은 대칭 행렬의 몇 가지 속성입니다.

  • 대칭 행렬과 그 역행렬은 모두 대칭입니다.
  • 고유값의 모든 값은 실수입니다. 복소수가 존재하지 않습니다.
  • 행렬에 전치 행렬을 곱하면 대칭 행렬이 형성됩니다.
  • 대칭 행렬은 인수분해 속성도 보유합니다.
  • 선형 독립 열이 있는 행렬의 경우 행렬에 전치 값을 곱한 결과는 반전 가능합니다.

3. 고유값과 고유벡터

고유 벡터는 스칼라 요인에 의해서만 변경되고 방향이 전혀 변경되지 않는 벡터입니다. 고유 벡터에 해당하는 고유값은 스케일링되는 크기입니다. 고유값과 고유 벡터는 수학 및 컴퓨팅의 기초에서 찾을 수 있습니다. XY 그래프에 벡터를 그릴 때 특정 방향을 따릅니다. 몇 개의 벡터에 선형 변환을 적용하면 방향이 바뀌지 않는다는 것을 알 수 있습니다. 이러한 벡터는 기계 학습에서 매우 중요합니다.

고유값과 고유 벡터는 데이터 노이즈를 최소화하는 데 사용됩니다. 또한 두 가지를 사용하여 계산 집약적인 것으로 알려진 작업의 효율성을 개선할 수 있습니다. 과적합을 없애는 데에도 사용할 수 있습니다. 고유값과 고유 벡터가 유용한 것으로 입증된 몇 가지 다른 시나리오도 있습니다.

소리, 문자 또는 이미지 데이터의 특징을 시각화하는 것은 상당히 어렵습니다. 이 데이터는 일반적으로 3차원으로 표시됩니다. 여기서 고유값과 고유벡터가 등장합니다. 매트릭스에 저장된 엄청난 양의 데이터를 모두 캡처하는 데 사용할 수 있습니다. 고유값과 고유 벡터는 얼굴 인식에도 사용됩니다.

읽기: 초보자를 위한 기계 학습 프로젝트 아이디어

4. 주성분 분석(PCA)

특정 기계 학습 문제를 해결할 때 차원이 문제를 어렵게 만드는 경우가 많습니다. 이러한 문제에서 우리는 기능 간에 매우 높은 상관 관계가 있고 평소보다 높은 차원에 있는 데이터를 다루고 있습니다.

이 차원 문제에서 나오는 문제는 모든 특성이 대상 변수에 미치는 영향을 이해하기가 매우 어려워진다는 것입니다. 정상보다 높은 상관 관계를 가진 피처가 동일한 방식으로 대상에 영향을 미치는 경향이 있기 때문입니다. 더 높은 차원의 데이터를 시각화하는 것도 매우 어렵습니다.

주성분 분석은 이러한 문제에 대한 솔루션입니다. 데이터 차원을 2차원 또는 3차원으로 낮추는 데 도움이 됩니다. 이것은 최대 분산의 변경으로 인해 정보가 손실되지 않도록 하기 위해 수행됩니다. PCA 뒤에 있는 수학은 직교성과 관련이 있습니다. PCA는 데이터 세트의 기능 수를 줄여 모델을 덜 복잡하게 만드는 데 사용할 수 있는 가장 좋은 방법입니다.

그러나 과적합을 제거하기 위한 초기 단계로 이를 사용하지 않아야 합니다. 데이터의 기능 수를 제한하거나 데이터 양을 늘리는 것으로 시작해야 합니다. 그런 다음 L1 또는 L2 정규화를 사용해 보십시오. 아무 것도 작동하지 않는 경우에만 PCA로 전환해야 합니다.

더 읽어보기: 당신이 알아야 할 상위 9가지 머신 러닝 라이브러리

기계 학습 전에 선형 대수학을 배워야 하는 이유는 무엇입니까?

1. 선형 대수학은 머신 러닝에서 탁월하기 위한 열쇠입니다.

고급 수학에 관해서는 미적분학이 선형 대수학을 능가한다는 사실을 부인할 수 없습니다. 적분 및 미분 미적분은 적분, 미분 및 극한뿐만 아니라 텐서 및 벡터와 같은 응용 프로그램에 필요한 기본 지식으로도 사용됩니다.

이러한 것들을 배우면 다른 영역 중에서 선형 방정식과 선형 함수를 더 잘 이해하는 데 도움이 됩니다. 또한 Simplex 방법 및 공간 벡터와 같은 고급 개념에 대해서도 알게 됩니다. 선형 계획법에 대한 도움이 필요한 경우 Simplex 방법을 사용할 수 있습니다. 이러한 개념을 더 잘 이해하려면 먼저 선형 대수학에 더 많은 시간을 할애하십시오.

2. 머신러닝 예측

선형 대수학을 배우면 머신 러닝에서 이처럼 중요한 역할을 하는 의식이나 본능이 향상됩니다. 이제 더 많은 관점을 제공할 수 있습니다. 당신이 공부한 행렬과 벡터는 당신의 생각을 넓히고 더 확고하게 만드는 데 도움이 될 것입니다. 가능성은 무한합니다. 주변 사람들이 이해하기 매우 어려운 일을 시작할 수 있습니다. 다양한 그래프를 시각화하고 설정하기 시작할 수 있습니다. 다른 기계 학습 구성 요소에 대해 더 많은 매개 변수를 사용할 수 있습니다.

3. 선형 대수는 더 나은 기계 학습 알고리즘을 만드는 데 도움이 됩니다.

선형 대수 학습을 사용하여 더 나은 지도 및 비지도 기계 학습 알고리즘을 구축할 수 있습니다. 로지스틱 회귀, 선형 회귀, 의사 결정 트리 및 지원 벡터 머신(SVM)은 선형 대수의 도움으로 처음부터 생성할 수 있는 몇 가지 지도 학습 알고리즘입니다.

반면에 SVD(단일 값 분해), 클러스터링 및 구성 요소 분석을 비롯한 비지도 알고리즘에도 사용할 수 있습니다. 선형 대수학은 작업 중인 기계 학습 프로젝트에 대한 더 깊은 이해를 개발하는 데 도움이 되므로 다양한 매개변수를 사용자 지정할 수 있는 유연성을 제공합니다. 기계 학습의 선형 회귀에 대해 자세히 알아볼 수 있습니다 .

4. 기계 학습에서 더 나은 그래픽 처리를 위한 선형 대수학

기계 학습 프로젝트는 이미지, 오디오, 비디오 및 에지 감지와 같이 작업할 다양한 그래픽 해석을 제공합니다. 기계 학습 알고리즘에는 범주를 기반으로 주어진 데이터 세트의 일부를 훈련하는 분류기가 있습니다. 분류기의 또 다른 작업은 이미 훈련된 데이터에서 오류를 제거하는 것입니다.

이 단계에서 선형 대수가 이 복잡하고 큰 데이터 세트를 계산하는 데 도움이 됩니다. 매트릭스 분해 기술을 사용하여 다양한 프로젝트에 대한 대용량 데이터를 처리하고 처리합니다. 가장 널리 사용되는 행렬 분해 방법은 QR 및 LU 분해입니다.

5. 통계에 대한 이해를 높이는 선형 대수학

통계는 기계 학습에서 데이터를 구성하고 통합하는 데 매우 중요합니다. 통계 개념을 더 잘 이해하려면 먼저 선형 대수가 어떻게 작동하는지 알아야 합니다. 선형 대수학에는 다변량 분석과 같은 고급 통계 주제를 프로젝트에 통합하는 데 도움이 되는 방법, 연산 및 표기법이 있습니다.

체중, 키, 혈압 및 심박수가 포함된 환자 데이터에 대해 작업하고 있다고 가정합니다. 작업 중인 데이터 세트의 여러 변수입니다. 여기서 체중이 증가하면 혈압이 증가한다고 가정해 보겠습니다. 이것이 선형 관계라는 것을 이해하는 것은 그리 어렵지 않습니다. 따라서 한 변수의 증가가 다른 변수에 어떤 영향을 미치는지 더 잘 이해하려면 선형 대수학을 잘 이해해야 합니다.

결론

머신 러닝 자체는 상당히 방대한 주제입니다. 그러나 선형 대수와 같이 ML 자체만큼 배우는 것이 중요한 다른 개념이 있습니다. 선형 대수학 및 기타 이러한 주제를 학습하면 기계 학습의 개념을 더 잘 이해하는 데 도움이 됩니다.

기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

기계 학습에서 미적분과 선형 대수 중 어느 것이 더 중요합니까?

기계 학습 분야에서 경력을 쌓을 계획이라면 이 분야의 기초가 수학에 깊숙이 있음을 이미 알고 있어야 합니다. 기계 학습 수학은 미적분학, 선형 대수학 및 통계의 3가지 핵심 영역으로 구성됩니다. 기계 학습에는 많은 벡터와 행렬이 포함되므로 선형 대수학은 가장 기본적인 부분을 구성합니다. 그러나 미적분은 기계 학습 메커니즘이 어떻게 작동하는지 이해하는 데 도움이 되므로 ML의 필수 부분이기도 합니다. 따라서 미적분학과 선형 대수학은 모두 똑같이 중요합니다. 그러나 둘 중 어느 정도를 사용해야 하는지는 주로 직무 역할과 책임에 따라 다릅니다.

선형 대수는 미적분보다 배우기가 더 어렵습니까?

선형 대수학은 선형 방정식을 사용하여 직선을 연구하는 반면, 미적분학은 도함수, 벡터, 적분, 곡선 등을 포함하는 매끄럽게 변화하는 구성 요소에 관한 것입니다. 즉, 선형 대수학은 기본 미적분학보다 배우기가 훨씬 간단합니다. 선형 대수학에서 선형 대수학 정리의 이면에 있는 이론을 이해하면 관련된 모든 문제를 해결할 수 있습니다. 그러나 미적분 문제를 해결하는 데 충분하지 않습니다. 단순히 알고리즘, 즉 이론 부분을 암기하는 것 이상으로 미적분학에서 계산적 질문에 답하기 위한 계산적 측면을 이해해야 합니다. 미적분학은 수학에서 가장 어려운 부분인 반면 선형 대수학은 보다 구체적이고 덜 추상적입니다. 이제부터 더 쉽게 이해할 수 있습니다.

기계 학습에서 통계가 중요합니까?

머신 러닝과 관련하여 통계에서 빠질 수는 없습니다. 머신러닝은 통계학을 응용한 것이라는 것이 전문가들의 의견이라 머신러닝 관련 진로를 희망하는 사람들에게는 필수 조건이다. 기계 학습 모델을 설계할 때 데이터는 근본적으로 중요한 역할을 합니다. 다양한 기계 학습 모델을 훈련하는 데 사용할 축적된 데이터를 기반으로 답을 찾으려면 통계적 기법이 필요합니다. 따라서 기계 학습을 위해서는 통계에 대한 기본적인 지식이 필수입니다.