길쌈 신경망: 2022년 초심자를 위한 궁극적인 가이드

게시 됨: 2021-01-05

"데이터 과학"에 대한 빠른 Google 검색은 누구에게나 명확하게 알려줍니다.
인기 있는 분야는 지난 5년 동안이 되었습니다. 데이터 과학과 함께 인공
인텔리전스, 머신 러닝, 딥 러닝도 인기를 끌고 있습니다.
컴퓨터 과학 분야. 이 목록에 가장 최근에 추가된 것은 컨볼루션 신경망입니다.
네트워크 - 컴퓨터 비전 분야의 혁신.

모든 것이 어디에서 시작되었습니까?

신경망은 Alex Krizhevsky가 우승한 2012년에 실제로 인기를 얻었습니다.
그 해 ImageNet 경쟁. 이 대회는 컴퓨터 올림픽과 유사합니다.
알렉스가 사용했을 때 분류 오류가 26%에서 15%로 떨어졌습니다.

이것은 기업과 컴퓨터가 바라는 틀림없는 희망의 레이저 광선이었습니다.
과학자들이 필요했습니다. 이후 인스타그램, 페이스북, 핀터레스트 등의 기업들이
최고의 경험을 제공하기 위해 열정적으로 신경망을 구현했습니다.
그들의 청중. 읽기: 신경망 튜토리얼.

합성곱 신경망의 생물학적 연결은
기초 클리어. 1962년 Hubel과 Wiesel은 서로 다른 뉴런이
시각 피질은 특정한 시각 신호가 있을 때만 발동됩니다. 함께 이러한
뉴런은 원주 구조를 가졌으며 발사되면 집합적으로 시각적으로 생성됩니다.
지각.

예를 들어, 일부 뉴런은 수평 가장자리에 노출되었을 때만 작동합니다.
수직 또는 대각선 가장자리가 있는 상태에서 발사되는 다른 것들. 따라서 서로 다른 뉴런
다양한 시각적 구성 요소에 반응하고 우리가 볼 수 있도록 했습니다.

컨볼루션 신경망이란 무엇입니까?

CNN 또는 ConvNet이라고도 하는 컨볼루션 신경망은 딥 러닝입니다.
연산. 입력 이미지를 가져와서 구성 요소에 가중치/편향을 할당합니다.
이미지를 만든 다음 전체 이미지를 분류합니다. 충분한 교육을 통해 ConvNet은
필터/분류를 학습할 수 있고 필요한 전처리는 다음과 같이 더 낮습니다.
다른 알고리즘에 비해 딥 러닝과 신경망의 차이점에 대해 읽어보세요.

우리가 궁극적으로 컨볼루션 신경망에서 원하는 것은
이미지 사이를 올바르게 분류합니다. 시간과 시간을 모두 포착할 수 있습니다.
관련 필터의 적용으로 인한 공간 종속성.

작동 원리의 기본

이미지의 해상도와 크기에 따라 이미지가 배열이 됩니다.

배열의 각 항목은 0에서 255 사이의 숫자로 구성됩니다(RGB 시스템이
사용 된). 이 숫자는 해당 지점의 픽셀 강도를 나타냅니다.

이 모든 숫자를 입력으로 받으면 컴퓨터는 숫자를 출력합니다. 이 번호
이미지가 특정 클래스(예: 집,
도로, 버스, 개, 고양이 등)

CNN의 구조

위의 이미지를 보면 convolutional에 많은 레이어가 있다고 생각할 수 있습니다.
신경망이지만 실제로는 3가지 주요 신경망만 있습니다. 여기에는 다음이 포함됩니다.
1. 컨볼루션 레이어
2. 풀링 계층
3. 완전 연결 계층
각각에 대해 더 자세히 알아보겠습니다.

컨볼루션 레이어

이것은 컨볼루션 신경망의 핵심 계층입니다. 그 매개변수는
필터 세트로 구성됩니다. 이 필터는 작지만 전체 깊이를 덮습니다.
입력 볼륨.

convolutional layer에서 수행되는 주요 작업은 high-level의 추출입니다.
특징. 첫 번째 것(위 이미지 참조)은 낮은 값을 추출하는 역할을 합니다.
색상, 가장자리 등과 같은 레벨 기능. 후속 컨볼루션 레이어는
따라서 이미지에 대한 완전한 이해/정독으로 이어집니다.

풀링 레이어

이 레이어는 이미지 표현의 공간 크기를 줄이기 위한 것입니다. 이와 같이,
또한 신경망에서 계산 및 처리량을 줄이는 데 도움이 됩니다.
또한 위치 및 회전 방향으로 지배적인 특징을 추출합니다.
불변.

한 가지 유형의 풀링은 Max 작업을 사용하여 수행됩니다. 이 작업은
이전 레이어의 각 뉴런 클러스터의 최대값. 풀링의 다른 유형
클러스터에서 평균 값을 반환하는 평균 풀링입니다.
Max pooling은 노이즈 억제 역할도 하기 때문에 Average보다 더 나은 성능을 보입니다.
풀링.

위의 이미지에서 볼 수 있듯이 풀링 레이어 외에도 여러 개의 풀링 레이어가 있습니다.
컨볼루션 레이어. 이러한 레이어의 수가 많을수록 더 낮은 수준의 기능이 제공됩니다.
추출됩니다. 그러나 소비되는 계산 능력도 증가할 것입니다.

이제 이미지가 현재의 모든 컨볼루션 및 풀링을 통과했으므로
레이어, 기능 추출이 완료되었습니다. 이제 이미지를 분류할 차례입니다. 완전 연결 계층이 이 작업을 수행합니다.

완전 연결 계층(FCL)

마지막 계층인 FC 계층은 단순히 피드포워드 신경망입니다. 에 대한 입력
완전 연결 계층은 마지막 풀링/컨볼루션의 평평한 출력입니다.
층. 평평하게 한다는 것은 3차원 행렬 또는 배열이 벡터로 펼쳐져 있음을 의미합니다.

각 FC 레이어에 대해 특정 수학적 계산이 수행됩니다. 벡터가 완전히 연결된 모든 계층을 통과한 후 최종 계층에서 softmax 활성화 함수가 사용됩니다. 이것은 특정 작업에 속하는 입력의 확률을 계산하는 데 사용됩니다.

따라서 최종 결과는 다른 클래스에 속하는 입력 이미지의 다른 확률입니다.

다른 유형의 이미지와 해당 유형 내의 개별 이미지에 대해 프로세스가 반복됩니다. 이것은 네트워크를 훈련시키고 개와 고양이, 장미와 해바라기를 구별하도록 가르칩니다.

테이크아웃

컨볼루션 신경망 의 기본 기술은 지속적으로 개선되고 있습니다. 네트워크는 정확한 확률을 출력하도록 많이 훈련되었습니다. 그것은 올바르게 말할 수 있습니다. 컴퓨터 비전 분야에서 CNN은 단독으로 혁명을 일으키고 있습니다.

실제 실습 워크샵, 일대일 업계 멘토, 12개의 사례 연구 및 과제, IIIT-B 동문 자격 등 을 제공하는 기계 학습 및 AI PG 디플로마를 확인할 수 있습니다.

AI 주도 기술 혁명 주도

기계 학습 및 인공 지능 PG 디플로마

더 알아보기