AI 엔지니어가 2022년에 배워야 할 최고의 딥 러닝 모델 유형

게시 됨: 2021-01-01

소개

딥 러닝은 비지도 및 지도 변환, 특징 추출, 분류 및 패턴 분석을 위해 다양한 비선형 정보 처리 계층을 활용하는 기계 학습 기술입니다.

비선형 방식의 정보 처리에 관해서는 서로 다른 계층적 계층으로 구성됩니다. 여기에서 일부 하위 수준 개념은 상위 수준 개념을 정의할 수 있습니다. 지도 학습은 기계 학습의 한 형태이며 훈련 단계에서 일련의 예제가 시스템의 입력으로 제출됩니다.

각 입력에는 출력 값으로 레이블이 지정되어 있으므로 시스템은 입력 집합이 제공될 때 출력을 알고 있습니다. 반면에 비지도 학습에서는 입력이 속한 클래스로 레이블이 지정되지 않습니다. 따라서 공통의 특성을 찾고 내부 지식을 기반으로 필요한 변경을 수행하여 데이터를 개발하고 구성하는 것은 시스템에 달려 있습니다.

인공 신경망은 얕습니다. 따라서 이미지, 자연스러운 음성, 정보 검색 및 인간과 유사한 정보 처리 응용 프로그램과 같은 일상적인 응용 프로그램에서 볼 수 있는 복잡한 데이터를 처리할 수 없습니다. 이러한 종류의 응용 프로그램에는 딥 러닝 모델 이 적합합니다. 딥 러닝의 도움으로 적은 노력으로 기계의 데이터 패턴을 분류, 인식 및 분류할 수 있습니다.

관련 문서: 최고의 딥 러닝 기술

딥 러닝 모델 유형

딥 러닝 모델은 진화하고 있으며 대부분은 인공 신경망을 기반으로 합니다. 그 중 가장 중요한 것은 CNN(Convolutional Neural Networks)입니다. 또한 심층 생성 모델에서 계층별로 구성된 잠재 변수 및 명제 공식을 포함합니다.

오토인코더

다양한 코딩 패턴을 학습할 수 있는 인공 신경망입니다. 오토인코더는 가장 단순한 형태의 입력 레이어, 은닉 레이어 또는 출력 레이어를 갖는 다층 퍼셉트론과 유사합니다. 출력 레이어는 출력 레이어와 동일한 수의 노드를 갖습니다. 출력 벡터를 기반으로 목표 값을 예측하지 않습니다. 대신 Autoencoder는 입력을 예측할 수 있습니다. 이 학습 메커니즘은 다음과 같이 요약할 수 있습니다.

각 입력 x에 대해,

모든 은닉층과 출력층에서 피드포워드가 전달되도록 하여 활성화 계산
계산된 값 사이의 편차를 감지하기 위해 적절한 오류 함수를 사용합니다.
오류를 역전파하여 가중치 업데이트
만족스러운 결과가 나올 때까지 작업을 계속 반복하십시오.

은닉층의 노드가 입력-출력 노드보다 적은 경우 마지막 은닉층의 활성화는 입력의 압축된 표현으로 간주됩니다. 은닉층 노드의 수가 더 많으면 자동인코더는 항등 함수를 학습하고 대부분의 경우 쓸모가 없는 것으로 판명됩니다.

깊은 믿음

이것은 일반적인 다층 퍼셉트론을 소유하는 국소 최소값 및 볼록하지 않은 목적 함수를 처리하는 솔루션을 제공합니다. 다른 계층과 상호 연결된 잠재 변수의 여러 계층으로 구성된 대체 유형의 딥 러닝으로 생각할 수 있습니다. 이것은 Boltzmann 기계의 제한된 버전입니다.

여기에서 각 하위 네트워크의 숨겨진 레이어는 네트워크의 인접 레이어에 대한 가시적인 입력 레이어 역할을 합니다. 따라서 네트워크의 인접 레이어에 대해 가장 낮은 가시 레이어를 훈련 세트로 만듭니다. 따라서 네트워크의 모든 계층은 탐욕스럽고 독립적으로 훈련될 수 있습니다. 심층 구조의 각 계층은 심층 구조의 각 계층을 훈련하기 위한 관찰 변수로 숨겨진 변수를 사용합니다. 깊은 믿음 네트워크를 훈련하기 위한 알고리즘은 다음과 같습니다.

입력 벡터 고려
Boltzmann 기계를 훈련하기 위해 입력 벡터를 사용하고 가중치 행렬을 얻습니다.
네트워크의 하위 두 계층을 훈련하기 위해 가중치 행렬을 사용합니다.
은닉 유닛의 평균 활성화 및 샘플링을 통해 새로운 입력 벡터를 생성하기 위해 네트워크 RBM을 사용합니다.
네트워크의 상위 두 계층에 도달할 때까지 절차를 계속 반복합니다.

더 읽어보기: 딥 러닝과 신경망

CNN(컨볼루션 신경망)

이것은 피드포워드를 기반으로 하는 다층 퍼셉트론의 또 다른 변형입니다. 시각적 영역에서 겹치는 모든 영역에 반응하는 방식으로 개별 뉴런을 구성합니다. 입력 이미지를 가져와 이미지의 다양한 측면/객체의 학습 가능한 편향 및 가중치에 중요성을 할당할 수 있는 딥 러닝 알고리즘 중 하나입니다.

그것은 서로를 구별할 수 있습니다. CNN에서 전처리의 필요성은 다른 분류 알고리즘과 비교할 때 상당히 낮습니다. CNN은 이러한 특성과 필터를 학습할 수 있는 능력을 가지고 있습니다.

CNN은 다음에 대한 주요 범주 중 하나입니다.

물체 감지

이미지 분류

이미지 인식

얼굴인식 등

이것은 CNN이 널리 사용될 수 있는 소수의 영역 중 일부입니다.

이미지 분류를 위해 CNN은 입력 이미지를 받아 처리하고 다른 범주로 분류합니다. 컴퓨터는 입력 이미지를 픽셀 배열로 시각화하며 이미지 해상도의 변수입니다. 기술적으로 CNN 모델은 훈련 및 테스트용 필터가 있는 여러 컨볼루션 레이어를 통해 각 입력 이미지를 처리합니다.

첫 번째 레이어는 입력 이미지에서 특징을 추출하기 위해 할당된 컨볼루션으로 알려져 있습니다. Convolution은 입력 데이터의 작은 정사각형을 사용하여 이미지 기능을 학습할 수 있으므로 픽셀 간의 관계를 유지할 수 있습니다. 이미지 행렬과 필터 또는 커널의 두 가지 입력을 받아 수학 연산을 실행합니다.

이미지 컨볼루션에 다른 필터가 제공되면 필터를 통해 가장자리 감지, 선명하게 하기 및 흐림과 같은 작업을 수행할 수 있게 됩니다.

지난 몇 년 동안 컴퓨터 비전 분야는 상당한 발전을 목격했습니다. 가장 큰 발전 중 하나는 CNN입니다. Deep CNN은 제스처 인식, 자율 주행 자동차, Facebook에 게시된 사진에 친구 자동 태그 추가, 안면 보안 기능 및 자동 번호판 인식에 사용되는 가장 멋진 컴퓨터 비전 애플리케이션으로 발전했습니다.

순환 신경망

이전 단계의 출력이 현재 단계의 입력으로 제공될 수 있는 일종의 신경망입니다. 기존 신경망의 입력과 출력은 서로 독립적입니다. 그러나 문장에서 연속되는 단어를 예측할 필요가 있는 경우에는 이전 단어를 기억할 필요가 있습니다.

RNN의 출현은 은닉층의 도움으로 이 문제를 해결할 것을 약속합니다. RNN의 주요 기능 중 하나는 시퀀스의 일부 정보를 기억할 수 있는 숨겨진 상태입니다.

RNN은 계산에 대한 모든 정보를 기억할 수 있는 메모리를 갖추고 있습니다. 원하는 출력을 생성하기 위해 모든 입력 또는 숨겨진 레이어에서 동일한 작업을 수행하기 위해 모든 입력에 대해 동일한 매개변수를 사용할 수 있습니다. 다른 신경망과 극명한 대조를 이루는 매개변수의 복잡성을 크게 줄입니다.

마지막 생각들

기울기 계산은 현재 단계뿐만 아니라 이전 단계에도 의존합니다. 여러 응용 프로그램에서 사용되는 양방향 순환 신경망이라는 변형이 있습니다. 여기에서 네트워크는 이전 및 예상되는 미래 출력을 고려합니다. 다중 은닉층을 도입함으로써 양방향 단순 순환 신경망에서 딥 러닝을 달성할 수 있습니다.

딥 러닝 기술 , 머신 러닝에 대해 자세히 알아보려면 작업 전문가를 위해 설계되었으며 240시간 이상의 엄격한 교육, 5개 이상의 사례 연구를 제공하는 IIIT-B & upGrad의 머신 러닝 및 딥 러닝 PG 인증을 확인하십시오. 및 과제, IIIT-B 동문 상태 및 최고의 기업에 대한 취업 지원.

AI 주도 기술 혁명 주도

기계 학습 및 인공 지능 PG 디플로마

더 알아보기