지도 학습 대 비지도 학습: 지도 학습과 비지도 학습의 차이점

게시 됨: 2020-11-30

소개

머신러닝은 크게 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)의 세 가지로 분류된다. 강화 학습은 아직 새롭고 빠르게 개발 중이므로 이 기사에서 이를 무시하고 지도 학습 및 비지도 학습에 대해 자세히 살펴보겠습니다.

이 두 가지 유형의 학습에 대한 실제 정의와 사용법으로 이동하기 전에 먼저 기계 학습에 대해 알아보겠습니다. 머신 러닝은 명시적으로 프로그래밍하지 않고도 경험을 통해 자동으로 학습하고 개선할 수 있는 기능을 시스템에 제공하는 인공 지능의 응용 프로그램입니다. 이 기사는 주로 데이터 과학 및 인공 지능 분야의 초보자를 위해 작성되었으므로 기계 학습의 교과서 정의일 뿐입니다. 여러분이 더 잘 이해하고 해석할 수 있도록 더 명확하고 흥미롭게 설명하겠습니다.

아기를 우리의 기계라고 생각하고 아기가 숫자 체계에서 다른 숫자를 배울 수 있도록 도와야 합니다. 아기가 배우는 것을 돕기 위해 우리는 아기에게 다른 숫자를 보여주고 각 숫자가 무엇인지 말해야 합니다.

이 부분을 반복하면 아기가 숫자를 배우고 암기하는 데 도움이 됩니다. 이것은 기계 학습과 같이 명시적으로 프로그래밍하지 않고도 경험을 통해 자동으로 배우고 개선하는 능력에 불과합니다.

읽기: 기계 학습 프로젝트 아이디어

지도 학습

지도 학습의 고전적인 교과서 정의로 다시 시작하고 이전에 취한 아기 예제에 익숙해지도록 합시다. 지도 학습은 예제 입력-출력 쌍을 기반으로 입력을 출력에 매핑하는 기능을 학습하는 기계 학습 작업입니다. 훈련 예제 세트로 구성된 레이블이 지정된 훈련 데이터에서 함수를 추론합니다.

나는 교과서에 쓰여진 정의가 너무 형식적이어서 이해하기가 싫어서 오히려 친구가 자신의 생각으로 정의를 설명하는 것을 선호합니다. 장기적으로 정의를 외우려고 할 때마다 결국 친구가 예를 들어 설명하는 것이 나타나 삶을 편안하게 만듭니다. 그래서, 이 기사에서 내가 당신에게 그 친구를 하자.

앞에서 살펴본 아기의 예를 다시 살펴보겠습니다. 이 경우 아기가 배우고 우리가 가지고 있는 다양한 과일을 식별하도록 해야 합니다. 사과와 오렌지를 우리의 두 과일로 생각하고 이 두 사진을 아기에게 보여주는 것으로 시작하겠습니다. 우리는 또한 어떤 그림이 어떤 과일인지 아기에게 알려줍니다.

이 사진을 보고 아기는 과일이 둥글고 붉은색 과일은 사과, 오렌지색 과일은 오렌지라는 것을 알게 됩니다. 이제 아기에게 새로운 오렌지 사진을 보여주고 사진이 사과인지 오렌지인지 찾아보라고 합시다.

아기는 과일이 오렌지라고 예측합니다. 우리가 사과와 오렌지와 같은 두 가지 과일을 두 가지 범주로 분류하고 아기에게 어떤 과일이 무엇인지 배우도록 요청했기 때문에 아기는 과일을 오렌지로 올바르게 예측합니다. 이것이 우리가 기계를 아기로 교체하는 경우 지도 머신 러닝이 작동하는 방식입니다.

지도 머신 러닝은 분류 및 회귀로 알려진 두 가지 유형의 문제로 더 분류됩니다.

분류

이름 자체에서 이것이 주어진 데이터를 두 개 이상의 클래스로 분류해야 하는 기계 학습 문제라는 것을 알 수 있습니다. 우리가 찍은 위의 예는 주어진 사진을 Apple 또는 Orange 클래스로 분류해야 하는 분류 문제입니다.

데이터를 분류할 클래스가 두 개뿐인 경우 이를 이진 분류라고 합니다. 그러나 실제 데이터에서는 하나 이상의 클래스가 있는 경향이 있으며 이를 다중 클래스 분류라고 합니다. 이러한 유형의 학습은 스팸 이메일을 식별하고, 고객을 분류하고, 고객이 운영자로부터 이탈하는지 여부를 확인하는 등 많은 사용 사례에 사용됩니다.

더 읽어보기: 기계 학습 경력

회귀

반면 회귀는 경험을 기반으로 급여를 예측하는 것과 같은 연속 데이터를 처리합니다. 이 경우 데이터를 클래스에 넣을 필요는 없지만 가지고 있는 연속 데이터를 기반으로 연속 값을 예측해야 합니다.

이러한 유형의 문제는 데이터 세트에 연속 열이 있는 반면 분류에는 범주 열이 있는 경향이 있습니다. 이러한 유형의 학습은 모든 회사의 다음 분기 재무 성장, 이전 점수를 기반으로 한 학생 점수 등을 예측하는 데 사용됩니다.

비지도 학습

비지도 학습은 기존 레이블이 없고 최소한의 인간 감독으로 데이터 세트에서 이전에 감지되지 않은 패턴을 찾는 일종의 기계 학습입니다.

일반적으로 사람의 레이블이 지정된 데이터를 사용하는 지도 학습과 대조적으로 자율 조직이라고도 하는 비지도 학습은 입력에 대한 확률 밀도의 모델링을 허용합니다. Unsupervised Machine Learning을 더 잘 이해하기 위해 아기의 예를 살펴보겠습니다.

이 예에서 입력으로 고양이와 개의 사진 그룹을 사용하겠습니다. 이전 예에서 아기는 사진에 레이블을 지정하고 분류한 Apple과 Orange라는 것을 알고 있습니다.

이 경우 아기는 아무것도 모르므로 어느 것이 고양이이고 어느 것이 개인지 분류할 수 없습니다. 그러나 다른 몇 장의 사진과 비교할 때 몇 장의 사진이 비슷해 보인다는 것을 알 수 있습니다. 이 경우 데이터에 레이블을 지정할 수 없지만 여전히 데이터에서 패턴을 찾을 수 있습니다. 이것이 비지도 머신 러닝이 작동하는 방식입니다.

클러스터링

위의 예는 클러스터링 문제를 명확하게 설명하므로 데이터에서 찾은 패턴을 기반으로 데이터 세트를 클러스터링해야 합니다. 클러스터링은 매우 중요한 기계 학습 문제이며 많은 회사에서 이 기술을 사용하여 데이터에서 귀중한 패턴과 통찰력을 찾는 경향이 있습니다.

결론

이 기사에서 우리는 다양한 유형의 기계 학습에 대해 알게 되었고 이해하기 쉬운 예를 들어 기계 학습을 이해하고 각 학습의 추가 분할을 조사했습니다. 이 기사는 기계 학습 문제의 기본 사항만 다루며, 문제 유형마다 기계 학습 알고리즘의 유형이 다릅니다.

기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

AI 주도 기술 혁명 주도

기계 학습 및 인공 지능 PG 디플로마

더 알아보기