피드포워드 신경망 소개: 계층, 기능 및 중요성

게시 됨: 2020-05-28

딥 러닝 기술은 검색 엔진, 기계 번역 및 모바일 애플리케이션의 중추입니다. 인간의 두뇌를 모방하여 다양한 종류의 데이터에서 패턴을 찾고 생성합니다.

이 놀라운 기술의 중요한 부분 중 하나는 패턴 인식 및 분류, 비선형 회귀 및 함수 근사에서 소프트웨어 엔지니어를 지원하는 피드포워드 신경망입니다.

핵심 신경망 아키텍처의 이 필수적인 측면에 대해 몇 가지 통찰력을 얻도록 합시다.

피드포워드 신경망이란 무엇입니까?

일반적으로 다층 뉴런 네트워크로 알려진 피드포워드 신경망은 모든 정보가 순방향으로만 이동한다는 사실 때문에 그렇게 불립니다.

정보는 먼저 입력 노드로 들어가고 은닉층을 통해 이동하고 마지막으로 출력 노드를 통해 나옵니다. 네트워크에는 출력 노드에서 나오는 정보를 네트워크로 다시 공급하기 위한 연결이 없습니다.

피드포워드 신경망은 함수를 근사화하기 위한 것입니다.

작동 방식은 다음과 같습니다 .

분류기 y = f*(x)가 있습니다.

이것은 입력 x를 범주 y에 공급합니다.

피드포워드 네트워크는 y = f(x; θ)를 매핑합니다. 그런 다음 함수에 가장 근접한 θ 값을 기억합니다.

Google 포토 앱에서 볼 수 있듯이 이미지의 객체 인식을 위한 기반을 위한 피드포워드 신경망.

피드포워드 신경망의 계층

피드포워드 신경망은 다음으로 구성됩니다.

입력 레이어

그것은 입력 수신 뉴런을 포함합니다. 그런 다음 입력을 다음 레이어로 전달합니다. 입력 레이어의 총 뉴런 수는 데이터 세트의 속성과 같습니다.

은닉층

이것은 입력 레이어와 출력 레이어 사이에 숨겨진 중간 레이어입니다. 이 레이어에는 입력에 변환을 적용하는 수많은 뉴런이 있습니다. 그런 다음 출력 레이어로 전달합니다.

출력 레이어

마지막 레이어이며 모델 빌드에 따라 다릅니다. 또한 출력 레이어는 원하는 결과가 무엇인지 알고 있는 예측된 기능입니다.

뉴런 가중치

뉴런 간의 연결 강도를 가중치라고 합니다. 가중치 값의 범위는 0에서 1입니다.

더 알아보기: 신경망 모델: 간략한 소개, 용어집

피드포워드 신경망의 비용 함수

비용 함수를 선택하는 것은 피드포워드 신경망에서 가장 중요한 부분 중 하나입니다. 일반적으로 가중치와 편향의 작은 변화는 분류된 데이터 요소에 영향을 미치지 않습니다. 따라서 부드러운 비용 함수를 사용하여 가중치와 편향을 약간 변경하여 성능을 향상시키는 방법을 알아냅니다.

평균 제곱 오차 비용 함수의 공식은 다음과 같습니다.

원천

어디에,

w = 네트워크의 가중치 모음

b = 편향

n = 훈련 입력의 수

a = 출력 벡터

x = 입력

‖v‖ = 벡터 v의 일반적인 길이

피드포워드 신경망의 손실 함수

신경망의 손실 함수는 학습 프로세스에 필요한 수정 사항이 있는지 확인하기 위한 것입니다.

출력 레이어 뉴런은 클래스 수와 같습니다. 예측된 확률 분포와 실제 확률 분포의 차이를 비교합니다.

이진 분류에 대한 교차 엔트로피 손실은 다음과 같습니다.

다중 클래스 분류에 대한 교차 엔트로피 손실은 다음과 같습니다.

원천

기울기 학습 알고리즘

이 알고리즘은 피드포워드 신경망에서 손실을 줄이기 위해 매개변수에 대해 가능한 모든 값을 결정하는 데 도움이 됩니다.

영상

모든 가중치(w₁₁₁, w₁₁₂,…)와 편향 b(b₁, b₂,….)는 무작위로 초기화됩니다. 이 작업이 완료되면 데이터의 관찰이 반복됩니다. 그런 다음 각 관측치에 대해 해당 예측 분포가 결정됩니다. 마지막으로 교차 엔트로피 함수를 사용하여 손실을 계산합니다.

그런 다음 손실 값은 모델의 전체 손실을 줄이기 위해 가중치를 변경하는 데 도움이 됩니다.

읽기: 13가지 흥미로운 신경망 프로젝트 아이디어 및 주제

뉴런 모델의 필요성

네트워크에 입력되는 입력이 문자의 스캔된 이미지에서 가져온 원시 픽셀 데이터라고 가정해 보겠습니다. 네트워크의 출력값이 숫자를 올바르게 분류하려면 올바른 양의 가중치와 편향을 결정해야 합니다.

이제 네트워크의 가중치를 약간 변경하여 학습이 어떻게 작동하는지 확인해야 합니다. 이것이 완벽하게 나오려면 가중치의 작은 변화가 출력의 작은 변화로 이어져야 합니다.

그러나 무게의 작은 변화가 출력의 큰 변화를 가져온다면 어떻게 될까요? S자형 뉴런 모델은 이러한 문제를 해결할 수 있습니다.

원천

더 읽어보기: 인공 신경망 ML 엔지니어에게 필요한 7가지 유형

결론

딥 러닝은 방대한 연구 범위를 가진 소프트웨어 엔지니어링의 영역입니다. 다양한 데이터 유형에 대해 많은 신경망 아키텍처가 구현되어 있습니다. 예를 들어, 컨볼루션 신경 시스템은 이미지 처리 절차 분야에서 동급 최고의 실행을 달성한 반면 순환 신경 시스템은 일반적으로 콘텐츠 및 음성 처리에 활용됩니다.

거대한 데이터 세트에 적용되는 시점에서 신경 시스템은 그래픽 처리 장치 또는 GPU 배열의 설계를 통해 달성할 수 있는 엄청난 계산력 및 장비 가속 측정이 필요합니다. GPU 활용이 처음인 경우 웹에서 무료로 구성된 설정을 찾을 수 있습니다. 가장 선호하는 것은 Kaggle Notebooks 또는 Google Collab Notebooks입니다.

효과적인 피드포워드 신경망을 달성하려면 많은 테스트가 필요한 네트워크 아키텍처에서 여러 번의 반복을 수행합니다.

이러한 네트워크의 작동 방식에 대한 자세한 내용은 upGrad의 전문가로부터 배우십시오. 우리의 과정은 매우 포괄적이며 경험이 풍부하고 동급 최고의 교사와 직접 연락하여 질문을 해결할 수 있습니다.

기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

신경망에 선형 대수학이 필요합니까?

신경망은 복잡한 문제를 해결하는 수학적 모델입니다. 네트워크는 원하는 결과를 달성하기 위해 입력 집합을 사용하고 출력 집합을 계산합니다. 신경망 이론을 공부할 때 대부분의 뉴런과 계층은 선형 대수 형식으로 지정되는 경우가 많습니다. 선형 대수학은 수학적 모델을 구성하는 데 필요합니다. 선형 대수학을 사용하여 모델의 네트워킹을 이해할 수도 있습니다. 따라서 질문에 대답하려면 네, 신경망을 사용하는 동안 선형 대수에 대한 기본 지식이 필수입니다.

신경망에서 역전파란 무엇을 의미합니까?

경사하강법을 사용하는 신경망의 경우 역전파가 사용됩니다. 이 알고리즘은 신경망의 가중치에 대한 오류 함수의 기울기를 추정하며 본질적으로 실수의 역전파입니다. 가중치를 미세 조정하면 오류율이 줄어들고 신경망 모델의 일반화가 향상되어 더 신뢰할 수 있기 때문에 이 접근 방식이 사용됩니다. 역전파는 신경망에서 손실 함수 기울기를 계산하기 위해 각 입력 값에 대해 알려진 의도된 결과가 필요하기 때문에 일반적으로 지도 머신 러닝의 한 형태로 분류됩니다.

역전파는 옵티마이저와 어떻게 다릅니까?

신경망에서는 옵티마이저와 역전파 알고리즘이 모두 사용되며 함께 작동하여 모델의 신뢰성을 높입니다. 역전파는 기울기를 효율적으로 계산하는 데 사용되며 옵티마이저는 역전파를 사용하여 얻은 기울기를 사용하여 신경망을 훈련하는 데 사용됩니다. 간단히 말해서, 역전파가 우리에게 하는 일은 옵티마이저에서 이후에 사용하는 그라디언트를 계산하는 것입니다.