당신이 알아야 할 10가지 딥 러닝 기술

게시 됨: 2020-05-29

소개

머신 러닝과 AI는 획기적인 혁신으로 지난 몇 년 동안 우리 주변의 세상을 변화시켰습니다. 또한 머신 러닝을 인간 두뇌의 신경망에서 영감을 받아 작업을 식별하는 방법을 학습할 수 있는 완전히 새로운 수준으로 끌어올리는 것은 다양한 딥 러닝 기술입니다. 스마트폰과 TV 리모컨을 음성으로 제어할 수 있는 이유입니다.

인간의 두뇌에 너무 복잡한 문제를 정확하고 효과적으로 해결하는 다양한 유형의 딥 러닝 모델이 있습니다. 방법은 다음과 같습니다.

상위 10가지 딥 러닝 기술

1. 고전적인 신경망

완전 연결된 신경망이라고도 하는 이 신경망은 뉴런이 연속 계층에 연결된 다층 퍼셉트론으로 식별되는 경우가 많습니다. 1958년 미국 심리학자 Fran Rosenblatt가 설계했습니다 . 기본 이진 데이터 입력에 모델을 적용하는 작업이 포함됩니다. 이 모델에는 다음과 같은 세 가지 기능이 포함되어 있습니다.

선형 함수: 정확히 말하면 입력에 상수 승수를 곱하는 단일 라인을 나타냅니다.
비선형 함수: 세 가지 하위 집합으로 더 나뉩니다.

S 자형 곡선: 0에서 1까지의 범위를 갖는 S자 곡선으로 해석되는 함수입니다.
쌍곡선 탄젠트(tanh) 는 -1에서 1 사이의 범위를 갖는 S자 곡선을 나타냅니다.
ReLU(Rectified Linear Unit): 입력 값이 설정 값보다 작으면 0을, 입력이 설정 값보다 크면 선형 배수를 생성하는 단일점 함수입니다.

가장 잘 작동:

CSV 형식의 행과 열이 있는 모든 테이블 데이터 세트
실제 값 입력에 대한 분류 및 회귀 문제
ANNS와 같이 유연성이 가장 높은 모든 모델

2. 컨볼루션 신경망

CNN은 고전적인 인공 신경망 모델의 잠재력이 높은 고급 유형입니다. 더 높은 복잡성, 전처리 및 데이터 컴파일을 처리하기 위해 구축되었습니다. 그것은 동물 뇌의 시각 피질에 존재하는 뉴런의 배열 순서에서 참조됩니다.

CNN은 이미지 및 비이미지 데이터를 전문으로 하는 가장 효율적이고 유연한 모델 중 하나로 간주될 수 있습니다. 여기에는 4개의 다른 조직이 있습니다.

단일 입력 레이어로 구성되며 일반적으로 1차 이미지 데이터를 분석하기 위한 뉴런의 2차원 배열로 포토 픽셀과 유사합니다.
일부 CNN은 흩어진 연결된 컨볼루션 레이어를 통해 입력에 대한 이미지를 처리하는 뉴런의 1차원 출력 레이어로도 구성됩니다.
CNN에는 해당 네트워크 계층과 관련된 뉴런의 수를 제한하기 위해 샘플링 계층으로 알려진 세 번째 계층도 있습니다.
전반적으로 CNN에는 샘플링을 출력 레이어에 연결하는 단일 또는 다중 연결된 레이어가 있습니다.

이 네트워크 모델은 더 작은 단위 또는 청크의 형태로 관련 이미지 데이터를 도출하는 데 도움이 될 수 있습니다. 컨볼루션 레이어에 있는 뉴런은 이전 레이어의 뉴런 클러스터를 담당합니다.

입력 데이터를 컨볼루션 모델로 가져오면 CNN 구축과 관련된 4단계가 있습니다.

컨볼루션: 프로세스는 입력 데이터에서 기능 맵을 파생시킨 다음 이 맵에 적용된 기능을 가져옵니다.
Max-Pooling: CNN이 주어진 수정 사항을 기반으로 이미지를 감지하는 데 도움이 됩니다.
평면화 : 이 단계에서 생성된 데이터는 CNN이 분석할 수 있도록 평면화됩니다.
완전 연결: 종종 모델의 손실 함수를 컴파일하는 은닉 계층으로 설명됩니다.

CNN은 이미지 인식, 이미지 분석, 이미지 분할, 비디오 분석 및 자연어 처리를 포함한 작업에 적합합니다. 그러나 CNN 네트워크가 다음과 같이 유용할 수 있는 다른 시나리오가 있을 수 있습니다.

OCR 문서 분석이 포함된 이미지 데이터 세트
더 빠른 분석을 위해 1차원으로 추가 변환할 수 있는 모든 2차원 입력 데이터
출력을 산출하려면 모델이 아키텍처에 관여해야 합니다.

더 읽어보기: 경련 신경망

3. 순환 신경망(RNN)

RNN은 처음에 시퀀스 예측을 돕기 위해 설계되었습니다. 예를 들어 LSTM(Long Short-Term Memory) 알고리즘은 여러 기능으로 알려져 있습니다. 이러한 네트워크는 가변 입력 길이의 데이터 시퀀스에서 전적으로 작동합니다.

RNN은 이전 상태에서 얻은 지식을 현재 예측에 대한 입력 값으로 넣습니다. 따라서 네트워크에서 단기 기억을 달성하는 데 도움이 될 수 있으며 주가 변동 또는 기타 시간 기반 데이터 시스템을 효과적으로 관리할 수 있습니다.

앞서 언급했듯이 문제 분석에 도움이 되는 두 가지 유형의 RNN 설계가 있습니다. 그들은:

LSTM: 메모리를 사용하여 시간 시퀀스의 데이터 예측에 유용합니다. Input, Output, Forget의 세 가지 게이트가 있습니다.
Gated RNN: 메모리를 통한 시간 시퀀스의 데이터 예측에도 유용합니다. 업데이트 및 재설정의 두 가지 게이트가 있습니다.

가장 잘 작동:

일대일: 이미지 분류와 같이 단일 출력에 연결된 단일 입력입니다.
일대다: 단일 이미지의 여러 단어를 포함하는 이미지 캡션과 같이 출력 시퀀스에 연결된 단일 입력.
다 대일: 감정 분석과 같은 단일 출력을 생성하는 일련의 입력.
다대다: 비디오 분류와 같은 일련의 출력을 생성하는 일련의 입력.

또한 언어 번역, 대화 모델링 등에 널리 사용됩니다.

세계 최고의 대학에서 온라인으로 최고의 기계 학습 과정 을 받으십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

4. 생성적 적대 네트워크

신경망 의 두 가지 딥 러닝 기술인 Generator와 Discriminator 를 결합한 것입니다 . Generator Network가 인공 데이터를 생성하는 동안 Discriminator는 실제 데이터와 거짓 데이터를 식별하는 데 도움이 됩니다.

Generator는 실제 데이터와 동일한 인공 데이터를 계속 생성하고 Discriminator는 실제 및 비현실 데이터를 지속적으로 감지하므로 두 네트워크 모두 경쟁력이 있습니다. 이미지 라이브러리를 생성해야 하는 시나리오에서 Generator 네트워크는 실제 이미지에 대한 시뮬레이션 데이터를 생성합니다. 그런 다음 디콘볼루션 신경망을 생성합니다.

그런 다음 실제 이미지와 가짜 이미지를 구별하기 위해 Image Detector 네트워크가 뒤따릅니다. 50% 정확도 확률 로 시작하여 생성기는 인공 이미지 생성에서 더 잘 성장할 것이기 때문에 탐지기는 분류 품질을 개발해야 합니다. 그러한 경쟁은 네트워크의 효율성과 속도에 전반적으로 기여할 것입니다.

가장 잘 작동:

이미지 및 텍스트 생성
이미지 향상
신약 개발 프로세스

5. 자기 조직화 지도

SOM 또는 Self-Organizing Maps 는 모델의 랜덤 변수 수를 줄이는 비지도 데이터의 도움으로 작동합니다. 이러한 유형의 딥 러닝 기술 에서는 각 시냅스가 입력 및 출력 노드에 연결되므로 출력 차원이 2차원 모델로 고정됩니다.

각 데이터 포인트가 모델 표현을 위해 경쟁할 때 SOM은 가장 가까운 노드 또는 BMU(Best Matching Units) 의 가중치를 업데이트합니다. BMU의 근접성에 따라 가중치 값이 변경됩니다. 가중치는 그 자체로 노드 특성으로 간주되므로 값은 네트워크에서 노드의 위치를 나타냅니다.

다음에서 가장 잘 작동합니다.

데이터세트에 Y축 값이 제공되지 않는 경우
데이터세트 프레임워크 분석을 위한 프로젝트 탐색
AI의 도움으로 음악, 비디오 및 텍스트의 창의적인 프로젝트

6. 볼츠만 기계

이 네트워크 모델에는 미리 정의된 방향이 없으므로 노드가 원형 배열로 연결되어 있습니다. 이러한 고유성 때문에 이 딥 러닝 기술 은 모델 매개변수를 생성하는 데 사용됩니다.

이전의 모든 결정적 네트워크 모델과 달리 Boltzmann Machines 모델은 확률적이라고 합니다.

가장 잘 작동:

시스템 모니터링
바이너리 추천 플랫폼 설정
특정 데이터세트 분석

읽기: 오늘 자신의 AI 시스템을 구축하는 단계별 방법

7. 심층 강화 학습

심층 강화 학습 기술을 이해하기 전에 강화 학습은 에이전트가 환경과 상호 작용하여 상태를 수정하는 프로세스를 나타냅니다. 에이전트는 상황을 관찰하고 그에 따라 조치를 취할 수 있으며 에이전트는 상황과 상호 작용하여 네트워크가 목표에 도달하도록 돕습니다.

여기 이 네트워크 모델에는 입력 계층, 출력 계층 및 여러 숨겨진 다중 계층이 있습니다. 여기서 환경의 상태는 입력 계층 자체입니다. 이 모델은 주어진 상황에서 취한 각 행동의 미래 보상을 예측하기 위한 지속적인 시도에서 작동합니다.

가장 잘 작동:

체스, 포커와 같은 보드 게임
자가 운전 자동차
로봇 공학
재고 관리
자산 가격 책정과 같은 재무 작업

8. 오토인코더

가장 일반적으로 사용되는 딥 러닝 기술 유형 중 하나인 이 모델은 활성화 함수와 최종 출력 디코딩을 수행하기 전에 입력을 기반으로 자동으로 작동합니다. 이러한 병목 현상은 더 적은 범주의 데이터를 생성하고 대부분의 고유 데이터 구조를 활용하게 합니다.

자동 인코더의 유형은 다음과 같습니다.

Sparse – 과적합을 줄이기 위해 일반화 접근 방식을 사용하기 위해 숨겨진 레이어가 입력 레이어보다 많은 경우. 이는 손실 함수를 제한하고 자동 인코더가 모든 노드를 과도하게 사용하는 것을 방지합니다.
노이즈 제거 – 여기에서 수정된 버전의 입력이 무작위로 0으로 변환됩니다.
축소 – 숨겨진 레이어가 입력 레이어보다 많을 경우 과적합 및 데이터 복사를 제한하기 위해 손실 함수에 페널티 요소를 추가합니다.
스택 형 – 자동 인코더에 다른 은닉층이 추가되면 디코딩의 한 단계에 대한 인코딩의 두 단계로 이어집니다.

가장 잘 작동:

특징 감지
강력한 추천 모델 설정
대규모 데이터세트에 기능 추가

읽기: 딥 러닝의 정규화

9. 역전파

딥 러닝 에서 역전파(backpropagation) 또는 역전파(back-prop) 기술은 신경망이 데이터 예측의 오류에 대해 학습하는 중심 메커니즘이라고 합니다. 반면에 전파는 전용 채널을 통해 주어진 방향으로 데이터를 전송하는 것을 말합니다. 전체 시스템은 결정의 순간에 순방향의 신호 전파에 따라 작동하고 네트워크의 단점에 관한 데이터를 역으로 되돌려 보냅니다.

첫째, 네트워크는 매개변수를 분석하고 데이터를 결정합니다.
둘째, 손실 함수로 가중치를 부여합니다.
셋째, 식별된 오류는 잘못된 매개변수를 자체 조정하기 위해 역전파됩니다.

가장 잘 작동:

데이터 디버깅

10. 경사하강법

수학적 맥락에서 기울기는 측정 가능한 각도를 가지며 변수 간의 관계로 나타낼 수 있는 기울기를 나타냅니다. 이 딥러닝 기법 에서 신경망에서 발생하는 오류와 데이터 매개변수의 오류 사이의 관계는 "x"와 "y"로 나타낼 수 있습니다. 변수는 신경망에서 동적이므로 작은 변경으로 오류를 늘리거나 줄일 수 있습니다.

많은 전문가들은 이 기법을 산비탈을 따라 내려가는 강길로 시각화합니다. 이러한 방법의 목적은 — 최적의 솔루션을 찾는 것입니다. 데이터가 트랩되어 느리고 잘못된 컴파일로 이어질 수 있는 신경망에는 여러 로컬 최소 솔루션이 있기 때문에 이러한 이벤트를 방지할 수 있는 방법이 있습니다.

산의 지형으로서 볼록 함수(Convex Functions)라고 하는 신경망 에 특정 기능이 있습니다. 이 기능은 데이터를 예상 속도로 흐르게 하고 최소값에 도달하도록 합니다. 함수의 초기값 변동으로 인해 최종 목적지에 데이터가 입력되는 방식에 차이가 있을 수 있습니다.

가장 잘 작동:

주어진 모델에서 매개변수 업데이트

더 읽어보기: 초보자를 위한 15가지 흥미로운 기계 학습 프로젝트 아이디어

마무리

기능과 실용적인 접근 방식과 함께 제공 되는 여러 딥 러닝 기술 이 있습니다. 이러한 모델이 식별되고 올바른 시나리오에 배치되면 개발자가 사용하는 프레임워크를 기반으로 하는 고급 솔루션을 달성할 수 있습니다. 행운을 빕니다!

기계 학습뿐만 아니라 클라우드 인프라를 사용하여 기계 학습의 효과적인 배포를 가르치는 프로그램을 만들려면 국내 최고의 공학 학교인 IIT Madras와 함께 기계 학습 및 클라우드 고급 인증 프로그램을 확인하십시오. 이 프로그램의 목표는 미국에서 가장 선택적인 기관의 문을 열고 학습자가 높고 성장하는 기술을 습득하기 위해 놀라운 교수진 및 리소스에 액세스할 수 있도록 하는 것입니다.

일반 적대 네트워크란?

생성기와 판별기라는 두 가지 딥 러닝 신경망 기술의 하이브리드입니다. Generator Network가 가상 데이터를 생성하는 동안 Discriminator는 실제 데이터와 가상 데이터를 구별하는 데 도움이 됩니다. Generator는 계속해서 정품 데이터와 동일한 거짓 데이터를 생성하고 Discriminator는 실제 데이터와 비현실 데이터를 계속 인식하기 때문에 두 네트워크 모두 경쟁력이 있습니다. Generator 네트워크는 이미지 라이브러리가 필요한 경우 실제 사진에 대한 시뮬레이션 결과를 생성합니다. 그 후, 디콘볼루션 신경망을 생성합니다.

자기 조직화 맵의 용도는 무엇입니까?

SOM(Self-Organizing Maps)은 감독되지 않은 데이터를 사용하여 모델의 랜덤 변수 수를 줄이는 방식으로 작동합니다. 각 뉴런이 입구 및 출구 노드에 연결됨에 따라 결과 차원은 이러한 종류의 딥 러닝 기술에서 2차원 모델로 설정됩니다. SOM은 각 데이터 포인트가 해당 모델 표현(BMU)에 입찰하기 때문에 가장 가까운 노드 또는 최적 일치 단위의 값을 조정합니다. 가중치의 값은 BMU가 얼마나 가까운지에 따라 달라집니다. 가중치는 그 자체로 노드 특성으로 간주되기 때문에 값은 네트워크에서 노드의 위치를 나타냅니다.

역전파란?

역전파 알고리즘 또는 역전파 접근 방식은 신경망이 딥 러닝에서 데이터 예측 실패에 대해 학습하는 중요한 요구 사항입니다. 반면에 전파는 정의된 채널을 통해 특정 방향으로 데이터를 전송하는 것을 말합니다. 선택의 순간에 전체 시스템은 신호 전파에 따라 순방향으로 작동할 수 있으며 네트워크 결함과 관련된 데이터를 역방향으로 되돌려 보냅니다.