비지도 머신 러닝은 어떻게 작동합니까?

게시 됨: 2018-06-13

비지도 학습은 분류되거나 레이블이 지정되지 않은 정보를 사용하여 AI 시스템을 훈련하는 것을 말합니다. 이것이 이상적으로 의미하는 바는 알고리즘이 사전 지침 없이 정보에 대해 작동해야 한다는 것입니다.
비지도 학습에서 기계는 유사점과 차이점에 관한 정렬되지 않은/정렬되지 않은 정보를 그룹화합니다. 이것은 머신이 데이터를 분류할 카테고리를 제공하지 않고 수행됩니다. 이러한 학습을 사용하는 시스템은 일반적으로 생성 학습 모델과 연관됩니다.

비지도 머신 러닝은 어떻게 작동합니까?

비지도 학습에서 AI 시스템은 레이블이 없고 범주화되지 않은 데이터로 제공되며 시스템의 알고리즘은 사전 교육 없이 데이터에 대해 작동합니다. 출력은 코딩된 알고리즘에 따라 다릅니다. 비지도 학습에 시스템을 적용하는 것은 해당 시스템의 기능을 테스트하는 확립된 방법입니다.
비지도 학습 알고리즘은 지도 학습 시스템보다 더 복잡한 처리 작업을 수행할 수 있습니다. 그러나 비지도 학습은 대체 모델보다 예측할 수 없습니다. 비지도 모델을 사용하여 훈련된 시스템은 예를 들어 고양이와 개를 구별하는 방법을 자체적으로 알아낼 수 있으며, 비정상적인 품종을 처리하기 위해 예기치 않은 및 바람직하지 않은 범주를 추가할 수도 있습니다. 주문하다.

비지도 학습 알고리즘의 경우 AI 시스템에는 레이블이 지정되지 않고 범주화되지 않은 데이터 세트가 제공됩니다. 명심해야 할 점은 이 시스템은 사전 교육을 받지 않았다는 것입니다. 본질적으로 비지도 학습은 교사 없이 학습하는 것으로 생각할 수 있습니다.
지도 학습의 경우 시스템에는 입력과 출력이 모두 있습니다. 따라서 원하는 출력과 관찰된 출력의 차이에 따라 시스템이 학습하고 개선하도록 설정됩니다. 그러나 비지도 학습의 경우 시스템에는 입력만 있고 출력은 없습니다.
머신 러닝이란 무엇이며 중요한 이유

비지도 학습은 데이터 마이닝 및 기능 추출과 관련된 작업 중에 매우 유용합니다. 비지도 학습의 궁극적인 목표는 데이터에서 숨겨진 추세와 패턴을 발견하거나 원하는 기능을 추출하는 것입니다. 앞서 말했듯이 비지도 학습은 사전 지식이나 학습 없이 입력 데이터 세트만 처리합니다. 따라서 비지도 학습에는 두 가지 유형이 있습니다.

파라메트릭 비지도 학습

매개변수 비지도 학습은 데이터의 매개변수 분포를 가정합니다. 이것이 의미하는 바는 이러한 유형의 비지도 학습은 데이터가 일부 매개변수를 기반으로 하는 특정 확률 분포를 따르는 모집단에서 온다고 가정한다는 것입니다. 이론적으로 개체군에 대한 정규 분포를 고려하면 모든 구성원이 비슷한 특성을 가지며 항상 평균과 표준 편차로 매개변수화된다는 것을 알 수 있습니다. 이것은 평균과 표준편차를 알고 분포가 정규분포라면 미래 관측의 확률을 매우 쉽게 찾을 수 있음을 의미합니다. Parametric Unsupervised Learning은 레이블이 없기 때문에 표준 지도 학습보다 훨씬 어렵습니다. 따라서 출력을 테스트하기 위한 사전 정의된 정확도 측정이 없습니다.

비모수적 비지도 학습

비모수적 비지도 학습은 입력 데이터 세트의 클러스터링을 나타냅니다. 기본적으로 각 클러스터는 집합에 있는 데이터 항목의 범주와 클래스에 대해 말합니다. 이것은 데이터 모델링 및 작은 표본 크기의 데이터 분석에 가장 일반적으로 사용되는 방법입니다. 이러한 방법은 매개변수 학습의 경우와 달리 모델러가 전체 모집단의 분포에 대해 가정할 필요가 없기 때문에 분포 없는 방법이라고도 합니다.
이 6가지 머신 러닝 기술은 의료 서비스를 개선합니다

이 시점에서 클러스터링이 의미하는 바에 대해 조금 더 깊이 파고드는 것이 중요합니다.

그렇다면 클러스터링이란 무엇입니까?

클러스터링은 비지도 학습과 관련하여 가장 중요한 기본 개념 중 하나입니다. 분류되지 않은 데이터 모음에서 구조나 패턴을 찾는 작업을 처리합니다. 클러스터의 간단한 정의는 "클래스의 각 구성원이 어떤 면에서 다른 구성원과 유사하도록 개체를 클래스로 그룹화하는 프로세스"일 수 있습니다.
따라서 클러스터는 클러스터 간에 "유사"하고 다른 클러스터의 개체와 "비유사"한 데이터 개체의 집합으로 간단하게 정의할 수 있습니다.

비지도 머신 러닝의 응용

비지도 머신 러닝의 목표는 데이터에서 이전에 숨겨진 패턴과 추세를 발견하는 것입니다. 그러나 대부분의 경우 데이터 패턴은 지도 머신 러닝이 달성할 수 있는 것에 대한 잘못된 근사치입니다. 예를 들어 고객을 개별적으로 취급하고 고도로 개인화된 커뮤니케이션을 제공하기보다는 큰 그룹으로 세분화합니다. 비지도 학습의 경우 결과가 무엇인지 알 수 없으므로 예측 모델을 설계해야 하는 경우 지도 학습이 실제 상황에서 더 합리적입니다.
비지도 머신 러닝을 사용하는 이상적인 사용 사례는 원하는 결과에 대한 데이터가 없을 때입니다. 예를 들어 완전히 새로운 제품의 목표 시장을 결정해야 하는 경우입니다. 그러나 소비자 기반을 더 잘 분류하려면 지도 학습이 더 나은 옵션입니다.
머신 러닝의 5가지 획기적인 애플리케이션

비지도 머신 러닝 기술의 몇 가지 응용 프로그램을 살펴보겠습니다.

비지도 학습은 데이터 세트에서 이상을 감지하는 데 매우 유용합니다. 이상 탐지는 데이터 컬렉션에서 중요한 데이터 포인트를 찾는 것을 말합니다. 이것은 사기 거래를 찾거나, 하드웨어의 고장난 부분을 발견하거나, 데이터 입력 중에 침투했을 수 있는 이상치를 식별하는 데 매우 유용합니다.
연관 마이닝은 데이터 세트에서 함께 발생하는 항목 세트를 식별하는 것을 의미합니다. 이것은 분석가가 함께 자주 구매하는 상품을 발견할 수 있도록 하므로 바구니 분석에 매우 유용한 기술입니다. 데이터를 클러스터링하지 않고 연관 마이닝은 불가능하며 클러스터링을 말할 때 비지도 머신 러닝 알고리즘을 이야기합니다.
비지도 학습의 또 다른 사용 사례는 차원 축소입니다. 데이터 세트의 기능 수를 줄여 더 나은 데이터 전처리를 가능하게 하는 것을 말합니다. 잠재 변수 모델은 일반적으로 이러한 목적으로 사용되며 비지도 학습 알고리즘을 사용해야만 가능합니다.

비지도 학습을 사용하여 발견된 패턴과 추세는 나중에 지도 학습 알고리즘을 적용할 때도 유용할 수 있습니다. 예를 들어, 비지도 학습은 데이터 세트에 대한 클러스터 분석을 수행하는 데 도움이 될 수 있으며 선택한 클러스터에서 지도 학습을 사용할 수 있습니다. 필요.
기계 학습 엔지니어: 신화 대 현실

대체로 머신 러닝과 인공 지능은 엄청나게 복잡한 분야이며, 여러분이 접하는 정교한 AI 시스템은 아마도 다양한 학습 알고리즘과 메커니즘의 조합을 사용하게 될 것입니다. 그렇긴 하지만 초보자라면 모든 기본 학습 기술을 중심으로 하는 핵심 사항을 알아야 합니다.

세계 최고의 대학에서 ML 과정을 배우십시오. 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.
비지도 학습 알고리즘의 미묘한 점을 명확히 할 수 있기를 바랍니다. 궁금하시다면 아래 댓글로 남겨주세요!

비지도 머신 러닝의 몇 가지 제한 사항을 언급하십시오.

비지도 머신 러닝의 경우 다양한 패턴을 파악하고 이를 도메인 전문 지식과 연결하기 위해 사람의 개입이 필요할 수 있으며 이는 비용이 많이 들 수 있습니다. 출력이나 결과가 부정확한 경우가 많습니다. 감독되지 않은 작업의 정렬 및 출력은 정확하게 정의할 수 없습니다. 이는 모델과 결과적으로 기계에 크게 의존합니다. 또한 총 코스 수는 알려지지 않았습니다. 그 결과 분석의 결론을 검증하기 어렵다.

비지도 머신 러닝의 연관 규칙은 무엇입니까?

연관 규칙은 여러 비지도 머신 러닝 방법 중 하나입니다. 연관 규칙을 사용하여 거대한 데이터베이스의 데이터 요소 사이에 관계를 생성할 수 있습니다. 대규모 데이터베이스에서 변수 간의 흥미로운 상관 관계를 발견하는 것이 이 비지도 접근 방식/알고리즘의 목표입니다. 연관 규칙은 모든 종류의 예측을 생성하고 특정 발생이 다른 것보다 더 많이 발생할 가능성을 평가하기 위한 훌륭한 기반을 제공하는 데 사용되는 일련의 접근 방식입니다.