사용 사례가 있는 기계 학습 알고리즘 유형

게시 됨: 2019-07-23

지능형 AI 비서 및 추천 엔진에서 정교한 IoT 장치에 이르기까지 오늘날 여러분이 누리고 있는 모든 혁신적인 특전은 데이터 과학, 더 구체적으로는 기계 학습의 결실입니다.

기계 학습의 응용 프로그램은 우리가 깨닫지도 못하는 사이 우리 일상의 거의 모든 측면에 침투했습니다. 오늘날 ML 알고리즘은 비즈니스, 금융 및 의료를 포함한 다양한 산업에서 필수적인 부분이 되었습니다. "ML 알고리즘"이라는 용어에 대해 셀 수 있는 것보다 더 많이 들었을 수 있지만, 이것이 무엇인지 알고 있습니까?

본질적으로 기계 학습 알고리즘은 고급 자가 학습 프로그램입니다. 데이터에서 학습할 수 있을 뿐만 아니라 경험을 통해 개선할 수도 있습니다. 여기서 "학습"은 시간이 지남에 따라 이러한 알고리즘이 명시적으로 프로그래밍되지 않은 상태에서 데이터 처리 방식을 계속 변경한다는 것을 의미합니다.

학습에는 입력을 출력에 매핑하는 특정 기능을 이해하거나 원시 데이터의 숨겨진 패턴을 발견하고 이해하는 것이 포함될 수 있습니다. ML 알고리즘이 학습하는 또 다른 방법은 '인스턴스 기반 학습' 또는 메모리 기반 학습을 통하는 것입니다.

오늘 우리는 다양한 종류의 기계 학습 알고리즘과 그 특정 목적을 이해하는 데 중점을 둘 것입니다.

지도 학습

이름에서 알 수 있듯이 지도 학습 접근 방식에서 알고리즘은 직접적인 인간 감독을 통해 명시적으로 훈련됩니다. 따라서 개발자는 알고리즘에 입력할 정보 출력의 종류를 선택하고 원하는 결과의 종류도 결정합니다. 프로세스는 다음과 같이 시작됩니다. 알고리즘은 입력 및 출력 데이터를 모두 수신합니다. 그런 다음 알고리즘은 입력을 출력에 매핑하는 규칙을 만들기 시작합니다. 이 교육 과정은 최고 수준의 성과에 도달할 때까지 계속됩니다. 따라서 결국 개발자는 원하는 출력을 가장 잘 예측하는 모델에서 선택할 수 있습니다. 여기서 목표는 학습 과정에서 상호 작용하지 않은 출력 객체를 할당하거나 예측하는 알고리즘을 학습시키는 것입니다.

여기서 주요 목표는 레이블이 지정된 샘플 데이터를 처리 및 분석하여 데이터 범위를 확장하고 미래 결과에 대해 예측하는 것입니다.

지도 학습의 가장 일반적인 사용 사례는 가격, 판매 및 주식 거래의 미래 추세를 예측하는 것입니다. 지도 알고리즘의 예로는 선형 회귀, 로지스틱 회귀, 신경망, 의사 결정 트리, 랜덤 포레스트, 지원 벡터 머신(SVM) 및 나이브 베이즈가 있습니다.

지도 학습 기술에는 두 가지 종류가 있습니다.

회귀 - 이 기술은 먼저 샘플 데이터의 패턴을 식별한 다음 연속 결과의 예측을 계산하거나 재현합니다. 그렇게 하려면 숫자, 값, 상관 관계 또는 그룹화 등을 이해해야 합니다. 회귀는 제품 및 주식의 프라이드 예측에 사용할 수 있습니다.

분류 – 이 기술에서 입력 데이터는 과거 데이터 샘플에 따라 레이블이 지정되고 특정 유형의 개체를 식별하도록 수동으로 훈련됩니다. 원하는 대상을 인식하는 방법을 학습한 다음 적절하게 분류하는 방법을 학습합니다. 이를 위해서는 획득한 정보를 구별하고 광학 문자/이미지/바이너리 입력을 인식하는 방법을 알아야 합니다. 분류는 일기 예보를 만들고, 사진에서 개체를 식별하고, 메일이 스팸인지 여부를 결정하는 데 사용됩니다.

원천

비지도 학습

레이블이 지정된 데이터를 사용하여 출력 예측을 수행하는 지도 학습 접근 방식과 달리, 비지도 학습은 레이블이 지정되지 않은 데이터에 대해서만 알고리즘을 제공하고 훈련합니다. 비지도 학습 접근 방식은 데이터의 내부 구조를 탐색하고 데이터에서 귀중한 통찰력을 추출하는 데 사용됩니다. 이 기술은 레이블이 지정되지 않은 데이터에서 숨겨진 패턴을 감지하여 더 나은 출력으로 이어질 수 있는 통찰력을 찾는 것을 목표로 합니다. 지도 학습을 위한 예비 단계로 사용할 수 있습니다.

비지도 학습은 기업에서 원시 데이터에서 의미 있는 통찰력을 추출하여 운영 효율성 및 기타 비즈니스 메트릭을 개선하는 데 사용됩니다. 디지털 마케팅 및 광고 분야에서 일반적으로 사용됩니다. 가장 널리 사용되는 비지도 알고리즘에는 K-평균 클러스터링, 연관 규칙, t-SNE(t-분산 확률적 이웃 임베딩) 및 PCA(주성분 분석)가 있습니다.

비지도 학습 기술에는 두 가지가 있습니다.

클러스터링 – 클러스터링은 클러스터 자격 증명에 대한 사전 정보 없이 데이터를 의미 있는 그룹 또는 "클러스터"로 분류하는 데 사용되는 탐색 기술입니다(따라서 내부 패턴에만 기반함). 클러스터 자격 증명은 개별 데이터 개체의 유사성과 나머지 개체와의 차이점에 따라 결정됩니다. 클러스터링은 유사한 콘텐츠를 특징으로 하는 트윗을 그룹화하고 다양한 유형의 뉴스 세그먼트 등을 분리하는 데 사용됩니다.

차원 축소 – 차원 축소는 입력 데이터의 더 좋고 간단할 수 있는 표현을 찾는 데 사용됩니다. 이 방법을 통해 입력 데이터는 모든 필수 비트를 유지하면서 중복 정보를 정리(또는 최소한 불필요한 정보를 최소화)합니다. 이러한 방식으로 데이터 압축을 허용하여 데이터의 저장 공간 요구 사항을 줄입니다. 차원 축소의 가장 일반적인 사용 사례 중 하나는 스팸 또는 중요한 메일로 메일을 분리하고 식별하는 것입니다.

반 지도 학습

준지도 학습은 지도 학습과 비지도 학습의 경계입니다. 고유한 알고리즘 세트를 생성하기 위해 두 세계의 장점을 병치합니다. 반 지도 학습에서는 레이블이 지정된 샘플 데이터의 제한된 세트를 사용하여 원하는 결과를 생성하도록 알고리즘을 훈련합니다. 레이블이 지정된 데이터의 제한된 세트만 사용하기 때문에 레이블이 지정되지 않은 데이터 세트에 레이블을 할당하는 부분적으로 훈련된 모델을 생성합니다. 따라서 궁극적인 결과는 레이블이 지정된 데이터 세트와 의사 레이블이 지정된 데이터 세트를 결합한 고유한 알고리즘입니다. 이 알고리즘은 지도 및 비지도 학습의 기술 및 예측 속성을 모두 혼합한 것입니다.

준지도 학습 알고리즘은 법률 및 의료 산업, 이미지 및 음성 분석, 웹 콘텐츠 분류 등에서 널리 사용됩니다. 반 지도 학습은 레이블이 지정되지 않은 데이터와 구조화되지 않은 데이터의 양이 급격히 증가하고 다양한 산업별 문제로 인해 최근 몇 년 동안 점점 인기를 얻고 있습니다.

강화 학습

강화 학습은 레이블이 지정된 데이터와 수신 데이터 간의 조합 및 상호 작용을 기반으로 시행착오의 지속적인 주기를 통해 스스로를 개선할 수 있는 자체 유지 및 자체 학습 알고리즘을 개발하려고 합니다. 강화 학습은 활동이 발생하는 탐색 및 활용 방법을 사용합니다. 행동의 결과가 관찰되고 그 결과에 따라 다음 행동이 뒤따릅니다. 계속해서 결과를 개선하기 위해 노력합니다.

훈련 과정에서 알고리즘이 특정/원하는 작업을 수행할 수 있게 되면 보상 신호가 트리거됩니다. 이러한 보상 신호는 강화 알고리즘을 위한 탐색 도구처럼 작동하여 특정 결과의 성취를 나타내고 다음 행동 과정을 결정합니다. 당연히 두 가지 보상 신호가 있습니다.

긍정적인 – 특정 작업 시퀀스가 계속되어야 할 때 트리거됩니다.

Negative – 이 신호는 특정 활동을 수행하는 데 패널티를 주고 앞으로 나아가기 전에 알고리즘의 수정을 요구합니다.

원천

강화 학습은 제한적이거나 일관성 없는 정보만 사용할 수 있는 상황에 가장 적합합니다. 비디오 게임, 최신 NPC, 자율 주행 자동차, 심지어 Ad Tech 운영에서도 가장 일반적으로 사용됩니다. 강화 학습 알고리즘의 예로는 Q-Learning, Deep Adversarial Networks, MCTS(Monte-Carlo Tree Search), TD(Temporal Difference) 및 A3C(Asynchronous Actor-Critic Agents)가 있습니다.

그러면 우리는 이 모든 것에서 무엇을 추론할 수 있습니까?

기계 학습 알고리즘은 방대한 데이터 세트에 숨겨진 패턴을 밝히고 식별하는 데 사용됩니다. 이러한 통찰력은 비즈니스 결정에 긍정적인 영향을 미치고 다양한 실제 문제에 대한 솔루션을 찾는 데 사용됩니다. 데이터 과학 및 기계 학습의 고급 덕분에 이제 특정 문제와 문제를 해결하기 위해 맞춤 제작된 ML 알고리즘이 있습니다. ML 알고리즘은 의료 애플리케이션, 프로세스 및 오늘날 비즈니스가 수행되는 방식을 변화시켰습니다.

기계 학습의 다른 알고리즘은 무엇입니까?

기계 학습에는 많은 알고리즘이 있지만 특히 인기 있는 알고리즘은 다음과 같습니다. 선형 회귀: 요소 간의 관계가 선형일 때 사용할 수 있습니다. 로지스틱 회귀: 요소 간의 관계가 비선형일 때 사용됩니다. 신경망: 상호 연결된 뉴런 세트를 구현하고 네트워크 전체에 활성화를 전파하여 출력을 생성합니다. k-최근접 이웃: 고려 중인 개체와 인접한 흥미로운 개체 집합을 찾아 기록합니다. Support Vector Machines: 훈련 데이터를 가장 잘 분류하는 초평면을 검색합니다. Naive Bayes: Bayes의 정리를 사용하여 주어진 이벤트가 발생할 확률을 계산합니다.

기계 학습의 응용 프로그램은 무엇입니까?

기계 학습은 인공 지능의 패턴 인식 및 계산 학습 이론 연구에서 발전한 컴퓨터 과학의 하위 분야입니다. 컴퓨터를 사용하여 예측하는 데 중점을 둔 컴퓨터 통계와 관련이 있습니다. 머신 러닝은 예측을 수행하는 소프트웨어를 수정하여 명시적 지침 없이 소프트웨어가 개선되도록 하는 자동화된 방법에 중점을 둡니다.

지도 학습과 비지도 학습의 차이점은 무엇입니까?

지도 학습: 샘플 세트 X와 해당 레이블 Y가 제공됩니다. 목표는 X에서 Y로 매핑하는 학습 모델을 구축하는 것입니다. 해당 매핑은 학습 알고리즘으로 표시됩니다. 일반적인 학습 모델은 선형 회귀입니다. 알고리즘은 데이터에 선을 맞추는 수학적 알고리즘입니다. 비지도 학습: 레이블이 지정되지 않은 샘플 세트 X만 제공됩니다. 당신의 목표는 아무런 지침 없이 데이터에서 패턴이나 구조를 찾는 것입니다. 이를 위해 클러스터링 알고리즘을 사용할 수 있습니다. 일반적인 학습 모델은 k-평균 클러스터링입니다. 알고리즘은 클러스터 알고리즘에 내장되어 있습니다.