인공 지능의 7가지 신경망 유형 설명

게시 됨: 2020-12-29

신경망은 뉴런과 은닉 계층을 활용하여 다른 방식으로 데이터와 패턴을 학습하는 기계 학습 기술의 하위 집합입니다. 신경망은 복잡한 구조로 인해 훨씬 더 강력하며 기존 기계 학습 알고리즘으로는 충분하지 않은 애플리케이션에서 사용할 수 있습니다.

이 튜토리얼을 마치면 다음과 같은 지식을 갖게 됩니다.

신경망의 간략한 역사
신경망이란
신경망의 유형

퍼셉트론
피드포워드 네트워크
다층 퍼셉트론
방사형 기반 네트워크
컨볼루션 신경망
순환 신경망
장단기 기억 네트워크

신경망의 간략한 역사

60년대의 연구원들은 인간 뉴런의 기능과 뇌가 작동하는 방식을 모방하는 방법을 연구하고 공식화했습니다. 디코딩이 매우 복잡하지만 Data의 숨겨진 패턴을 학습하는 데 매우 효율적일 수 있는 유사한 구조가 제안되었습니다.

20세기의 대부분 동안 신경망은 무능한 것으로 간주되었습니다. 그것들은 복잡하고 성능이 좋지 않았습니다. 또한 당시에는 사용할 수 없었던 많은 컴퓨팅 성능이 필요했습니다. 그러나 "딥 러닝의 아버지"라고도 불리는 제프리 힌튼 경의 팀이 역전파에 대한 연구 논문을 발표했을 때 상황은 완전히 바뀌었습니다. 신경망은 이제 생각하지 못했던 것을 달성할 수 있습니다.

신경망이란 무엇입니까?

신경망은 다중 입력, 처리 장치 및 단일/다중 출력이 있는 인간 뉴런의 아키텍처를 사용합니다. 뉴런의 각 연결과 관련된 가중치가 있습니다. 이러한 가중치를 조정하여 신경망은 보이지 않는 새로운 데이터의 출력을 예측하는 데 사용되는 방정식에 도달합니다. 이 프로세스는 가중치의 역전파 및 업데이트에 의해 수행됩니다.

신경망의 유형

다양한 데이터와 애플리케이션에 다양한 유형의 신경망이 사용됩니다. 신경망의 다양한 아키텍처는 특정 유형의 데이터 또는 도메인에서 작동하도록 특별히 설계되었습니다. 가장 기본적인 것부터 시작하여 더 복잡한 것으로 가자.

퍼셉트론

퍼셉트론은 가장 기본적이고 가장 오래된 형태의 신경망입니다. 입력을 받고 활성화 기능을 적용하여 이진 출력을 생성하는 단 1개의 뉴런으로 구성됩니다. 숨겨진 레이어가 포함되어 있지 않으며 이진 분류 작업에만 사용할 수 있습니다.

뉴런은 가중치와 함께 입력 값을 더하는 처리를 수행합니다. 결과 합계는 활성화 함수로 전달되어 이진 출력을 생성합니다.

이미지 소스

자세히 알아보기: 딥 러닝과 신경망

피드포워드 네트워크

Feed Forward(FF) 네트워크는 서로 연결된 여러 개의 뉴런과 숨겨진 레이어로 구성됩니다. 데이터가 순방향으로만 흐르고 역전파가 없기 때문에 이것을 "피드포워드"라고 합니다. 숨겨진 레이어는 애플리케이션에 따라 네트워크에 반드시 존재하지 않을 수 있습니다.

레이어 수가 많을수록 가중치를 사용자 정의할 수 있습니다. 따라서 네트워크의 학습 능력이 더욱 향상될 것입니다. 역전파가 없기 때문에 가중치가 업데이트되지 않습니다. 입력과 가중치를 곱한 출력은 임계값으로 작동하는 활성화 함수에 제공됩니다.

FF 네트워크는 다음에서 사용됩니다.

분류
음성 인식
얼굴 인식
패턴 인식

이미지 소스

다층 퍼셉트론

Feed Forward 네트워크의 주요 단점은 역전파로 학습할 수 없다는 것입니다. 다층 퍼셉트론은 여러 은닉층과 활성화 기능을 통합하는 신경망입니다. 학습은 Gradient Descent를 통해 가중치가 업데이트되는 감독 방식으로 진행됩니다.

다층 퍼셉트론은 양방향입니다. 즉, 입력의 순방향 전파 및 가중치 업데이트의 역방향 전파입니다. 활성화 함수는 대상 유형에 따라 변경될 수 있습니다. Softmax는 일반적으로 다중 클래스 분류에 사용되며 Sigmoid는 이진 분류에 사용됩니다. 한 계층의 모든 뉴런이 다음 계층의 모든 뉴런에 연결되어 있기 때문에 밀도 네트워크라고도 합니다.

딥 러닝 기반 애플리케이션에서 사용되지만 복잡한 구조로 인해 일반적으로 느립니다.

이미지 소스

방사형 기저 네트워크

RBN(Radial Basis Networks)은 완전히 다른 방식으로 표적을 예측합니다. 입력 레이어, RBF 뉴런이 있는 레이어 및 출력으로 구성됩니다. RBF 뉴런은 각 훈련 데이터 인스턴스에 대한 실제 클래스를 저장합니다. RBN은 활성화 함수로 사용되는 방사형 함수 때문에 일반적인 다층 퍼셉트론과 다릅니다.

새 데이터가 신경망에 입력되면 RBF 뉴런은 기능 값의 유클리드 거리를 뉴런에 저장된 실제 클래스와 비교합니다. 이는 특정 인스턴스가 속한 클러스터를 찾는 것과 유사합니다. 거리가 최소인 클래스를 예측 클래스로 지정합니다.

RBN은 주로 Power Restoration 시스템과 같은 함수 근사 응용 프로그램에서 사용됩니다.

이미지 소스

더 읽어 보기: 현실 세계의 신경망 애플리케이션

컨볼루션 신경망

이미지 분류와 관련하여 가장 많이 사용되는 신경망은 CNN(Convolution Neural Networks)입니다. CNN은 이미지에서 중요한 특징을 추출하는 여러 컨볼루션 레이어를 포함합니다. 이전 레이어는 낮은 수준의 세부 사항을 담당하고 이후 레이어는 더 높은 수준의 기능을 담당합니다.

컨볼루션 연산은 필터라고도 하는 사용자 지정 행렬을 사용하여 입력 이미지에 대해 컨볼루션을 수행하고 맵을 생성합니다. 이러한 필터는 무작위로 초기화된 다음 역전파를 통해 업데이트됩니다. 이러한 필터의 한 예는 모든 이미지에서 가장자리를 찾는 데 사용되는 Canny Edge Detector입니다.

컨볼루션 레이어 다음에는 컨볼루션 레이어에서 생성된 맵의 집계를 담당하는 풀링 레이어가 있습니다. Max Pooling, Min Pooling 등이 될 수 있습니다. 정규화를 위해 CNN에는 과적합과 빠른 수렴을 줄이기 위해 특정 뉴런을 삭제하거나 비활성화하는 드롭아웃 레이어를 추가하는 옵션도 포함되어 있습니다.

CNN은 은닉층에서 활성화 함수로 ReLU(Rectified Linear Unit)를 사용합니다. 마지막 계층으로 CNN은 완전히 연결된 밀집 계층과 분류의 경우 대부분 Softmax, 회귀의 경우 대부분 ReLU로 활성화 함수를 사용합니다.

이미지 소스

순환 신경망

순차 데이터를 사용한 예측이 필요할 때 순환 신경망이 필요합니다. 순차 데이터는 이미지, 단어 등의 시퀀스가 될 수 있습니다. RNN은 레이어가 이전 인스턴스 예측의 시간 지연 입력을 수신한다는 점을 제외하고 Feed-Forward 네트워크의 구조와 유사합니다. 이 인스턴스 예측은 모든 예측에 대한 두 번째 입력인 RNN 셀에 저장됩니다.

그러나 RNN의 주요 단점은 이전 레이어의 가중치를 기억하기 매우 어렵게 만드는 Vanishing Gradient 문제입니다.

이미지 소스

장단기 기억 네트워크

LSTM 신경망은 장기간 정보를 저장할 수 있는 특수 메모리 셀을 추가하여 RNN의 Vanishing Gradient 문제를 극복합니다. LSTM은 게이트를 사용하여 사용하거나 잊어야 하는 출력을 정의합니다. 입력 게이트, 출력 게이트 및 Forget 게이트의 3가지 게이트를 사용합니다. 입력 게이트는 모든 데이터가 메모리에 보관되어야 하는 것을 제어합니다. 출력 게이트는 다음 레이어에 제공되는 데이터를 제어하고 망각 게이트는 필요하지 않은 데이터를 덤프/잊는 시기를 제어합니다.

LSTM은 다음과 같은 다양한 애플리케이션에 사용됩니다.

제스처 인식
음성 인식
텍스트 예측

가기 전에

신경망은 네트워크에 계층을 계속 추가하면 순식간에 매우 복잡해질 수 있습니다. 사전 훈련된 네트워크를 사용하여 이 분야의 방대한 연구를 활용할 수 있는 경우가 있습니다.

이것을 전이 학습이라고 합니다. 이 튜토리얼에서는 대부분의 기본 신경망과 그 기능을 다루었습니다. Keras 및 Tensorflow와 같은 딥 러닝 프레임워크를 사용하여 이를 시도하십시오.

신경망, 기계 학습 및 AI에 대해 자세히 알아보려면 작업 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구를 제공하는 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하십시오. 및 과제, IIIT-B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

신경망이란 무엇입니까?

신경망은 비선형 분류 및 회귀를 수행하는 데 사용할 수 있는 확률 모델입니다. 즉, 입력 공간에서 출력 공간으로의 매핑을 근사화합니다. 신경망의 흥미로운 점은 많은 데이터로 훈련할 수 있고 복잡한 비선형 동작을 모델링하는 데 사용할 수 있다는 것입니다. 많은 예제로 훈련할 수 있으며 아무런 지침 없이 패턴을 찾는 데 사용할 수 있습니다. 따라서 신경망은 무작위성과 복잡성이 있는 많은 애플리케이션에서 사용됩니다.

신경망의 3가지 주요 범주는 무엇입니까?

신경망은 뇌와 유사한 학습에 대한 컴퓨터 접근 방식입니다. 신경망에는 세 가지 주요 범주가 있습니다. 분류, 시퀀스 학습 및 함수 근사는 신경망의 세 가지 주요 범주입니다. Perceptron, Hopfield, Self-organizing maps, Boltzmann machines, Deep belief network, Auto encoders, Convolutional neural network, Restricted Boltzmann machines, Continuous valued neural network, Recurrent neural network 및 Functional link network와 같은 많은 유형의 신경망이 있습니다.

신경망의 한계는 무엇입니까?

신경망은 많은 수의 입력과 많은 출력이 있는 문제를 해결할 수 있습니다. 그러나 신경망에도 한계가 있습니다. 신경망은 분류에 주로 사용됩니다. 그들은 회귀에 매우 나쁜 성능을 보입니다. 그리고 이것은 매우 중요한 점입니다. 신경망에는 많은 훈련 데이터가 필요합니다. 데이터 세트가 작으면 신경망은 기본 규칙을 학습할 수 없습니다. 신경망의 또 다른 한계는 블랙박스라는 것입니다. 투명하지 않습니다. 신경망의 내부 구조는 이해하기 쉽지 않습니다.