Учебное пособие по нейронной сети: пошаговое руководство для начинающих
Опубликовано: 2019-11-20В области машинного обучения есть много интересных концепций. Здесь, в этом руководстве по нейронным сетям, мы обсудим одну из фундаментальных концепций нейронных сетей. Эта статья поможет вам понять работу этих сетей, объясняя теорию, стоящую за ними.
После изучения этого руководства по искусственной нейронной сети вы узнаете:
- Что такое нейронная сеть?
- Как работает нейронная сеть?
- Какие существуют типы нейронных сетей?
Оглавление
Что такое нейронные сети?
Нейронная сеть — это система, предназначенная для работы подобно человеческому мозгу. Это довольно просто, но широко распространено в нашей повседневной жизни.
Сложным определением было бы то, что нейронная сеть — это вычислительная модель, имеющая сетевую архитектуру. Эта архитектура состоит из искусственных нейронов. Эта структура имеет определенные параметры, с помощью которых ее можно модифицировать для выполнения определенных задач.
Они обладают обширными аппроксимационными свойствами. Это означает, что они могут аппроксимировать функцию с любым уровнем точности, независимо от ее размерности. Нейронные сети находят широкое применение в тех областях, где традиционные компьютеры не слишком хороши. От Siri до Google Maps нейронные сети присутствуют везде, где используется искусственный интеллект.
Они являются жизненно важной частью операций искусственного интеллекта. Нейронные сети черпают вдохновение в человеческом мозге, поэтому их структура также похожа на одну.

Как работает нейронная сеть?
Нейронная сеть имеет много слоев. Каждый слой выполняет определенную функцию, и чем сложнее сеть, тем больше слоев. Вот почему нейронную сеть также называют многослойным персептроном.
Самая чистая форма нейронной сети состоит из трех слоев:
- Входной слой
- Скрытый слой
- Выходной слой
Как следует из названий, каждый из этих слоев имеет определенную цель. Эти слои состоят из узлов. В нейронной сети может быть несколько скрытых слоев в соответствии с требованиями. Входной слой принимает входные сигналы и передает их следующему слою. Он собирает данные из внешнего мира.
Скрытый слой выполняет все внутренние задачи расчета. Сеть может даже не иметь скрытых слоев. Однако в нейронной сети есть как минимум один скрытый слой. Выходной слой передает окончательный результат вычисления скрытого слоя.
Как и в других приложениях машинного обучения, вам также придется обучить нейронную сеть с помощью некоторых обучающих данных, прежде чем вы предоставите ей конкретную задачу. Но прежде чем мы углубимся в то, как нейронная сеть решает проблему, вы должны сначала узнать о работе слоев персептрона:
Как работают слои персептрона?
Нейронная сеть состоит из множества слоев персептрона; вот почему он носит название «многослойный персептрон». Эти слои также называются скрытыми слоями плотных слоев. Они состоят из множества персептронных нейтронов. Они являются основной единицей, которая работает вместе, чтобы сформировать уровень персептрона. Эти нейроны получают информацию в наборе входов. Вы объединяете эти числовые входные данные со смещением и группой весов, что затем дает один результат.
Для вычислений каждый нейрон учитывает веса и смещения. Затем комбинированная функция использует вес и смещение для получения выходных данных (модифицированных входных данных). Он работает по следующему уравнению:
комбинация = смещение + веса * входные данные
После этого функция активации выводит следующее уравнение:
выход = активация (комбинация)
Эта функция определяет, какую роль выполняет нейронная сеть. Они образуют слои сети. Ниже приведены распространенные функции активации:
Линейная функция
В этой функции выходом является только комбинация нейрона:
активация = комбинация
Гиперболическая касательная функция
Это самая популярная функция активации среди нейронных сетей. Это сигмовидная функция, и она находится между -1 и +1:
активация = тан (комбинация)
Логистическая функция
Логистическая функция очень похожа на функцию гиперболического тангенса, потому что она также является своего рода сигмовидной функцией. Однако он отличается тем, что лежит между 0 и 1:
активация = 1 1 + e -комбинация
Выпрямленная линейная единичная функция
Как и функция гиперболического тангенса, преобладает функция выпрямленной линейной единицы. Другое название выпрямленной линейной единичной функции — ReLU. ReLU равен комбинации, когда она равна или больше нуля, и отрицателен, если комбинация меньше (отрицательного) нуля.
Итак, как именно работает нейронная сеть?
Теперь, когда вы знаете, что стоит за нейронной сетью и как она работает, мы можем сосредоточиться на работе нейронной сети.
Вот как это работает:
- Информация подается на входной слой, который передает ее скрытому слою.
- Взаимосвязи между двумя слоями случайным образом присваивают веса каждому входу.
- Смещение добавляется к каждому входу после того, как веса умножаются на них по отдельности.
- Взвешенная сумма передается в функцию активации
- Функция активации определяет, какие узлы следует активировать для извлечения признаков.
- Модель применяет прикладную функцию к выходному слою для доставки выходных данных.
- Веса корректируются, а выходные данные распространяются обратно, чтобы минимизировать ошибку.
Модель использует функцию стоимости, чтобы уменьшить частоту ошибок. Вам придется менять веса в разных тренировочных моделях.

- Модель сравнивает вывод с исходным результатом
- Он повторяет процесс для повышения точности
Модель корректирует веса на каждой итерации, чтобы повысить точность выходных данных.
Присоединяйтесь к онлайн- курсу по искусственному интеллекту в ведущих университетах мира — магистерским программам, программам последипломного образования для руководителей и продвинутой сертификационной программе в области машинного обучения и искусственного интеллекта, чтобы ускорить свою карьеру.
Типы нейронных сетей
1) Рекуррентная нейронная сеть (RNN)
В этой сети выходные данные слоя сохраняются и передаются обратно на вход. Таким образом, узлы определенного слоя запоминают некоторую информацию о прошлых шагах. Комбинация входного слоя представляет собой произведение суммы весов и признаков. Рекуррентный процесс нейронной сети начинается в скрытых слоях.
Здесь каждый узел запоминает некоторую информацию о своем предыдущем шаге. Модель сохраняет некоторую информацию от каждой итерации, которую она может использовать позже. Система самообучается, когда ее результат неверен. Затем он использует эту информацию для повышения точности предсказания при обратном распространении. Наиболее популярным применением RNN является технология преобразования текста в речь.
2) Сверточная нейронная сеть (CNN)
Эта сеть состоит из одного или нескольких сверточных слоев. Сверточный слой, присутствующий в этой сети, применяет функцию свертки к входным данным, прежде чем передавать их на следующий уровень. Благодаря этому сеть имеет меньше параметров, но становится более глубокой. CNN широко используются в обработке естественного языка и распознавании изображений.
3) Нейронная сеть с радиальной базисной функцией (RBFNN)
Эта нейронная сеть использует радиальную базисную функцию. Эта функция учитывает расстояние точки от центра. Эти сети состоят из двух слоев. Скрытый слой объединяет функции с функцией радиального базиса и передает выходные данные следующему слою.
Следующий слой выполняет то же самое, используя выходные данные предыдущего слоя. Нейронные сети с радиальной базисной функцией используются в энергосистемах.

4) Нейронная сеть с прямой связью (FNN)
Это самая чистая форма искусственной нейронной сети. В этой сети данные перемещаются в одном направлении, т. е. от входного слоя к выходному слою. В этой сети выходной слой получает сумму произведений входов и их весов. В этой нейронной сети нет обратного распространения. Эти сети могут иметь много скрытых слоев или вообще не иметь их. Их легче поддерживать и находить применение в распознавании лиц.
5) Модульная нейронная сеть
Эта сеть имеет несколько сетей, которые функционируют независимо. Все они выполняют определенные задачи, но не взаимодействуют друг с другом в процессе вычислений.
Таким образом, модульная нейронная сеть может выполнять очень сложную задачу с гораздо большей эффективностью. Эти сети сложнее поддерживать по сравнению с более простыми сетями (такими как FNN), но они также обеспечивают более быстрые результаты для сложных задач.
Узнайте больше о нейронных сетях
Вот и все в нашем учебнике по нейронной сети. Вы наверняка видели, какое разнообразие задач могут выполнять эти сети. Они используются почти во всех технологиях, которые мы используем ежедневно. Если вы хотите узнать больше о нейронных сетях, вы можете просмотреть наш каталог курсов по искусственному интеллекту и машинному обучению.
Вы можете проверить нашу программу Executive PG в области машинного обучения и искусственного интеллекта , которая включает практические семинары, индивидуального отраслевого наставника, 12 тематических исследований и заданий, статус выпускника IIIT-B и многое другое.
Как работает нейронная сеть?
Входной слой получает данные и передает их скрытому слою. Веса присваиваются каждому входу случайным образом с помощью связей между двумя слоями. После умножения весов на них по отдельности к каждому входу применяется смещение. В функцию активации передается взвешенная сумма. Для извлечения признаков функция активации решает, какие узлы следует активировать. Для доставки выходных данных модель использует прикладную функцию на выходном слое. Чтобы уменьшить ошибку, веса изменяются, а выходные данные распространяются обратно.
Что такое рекуррентная нейронная сеть?
Выход слоя сохраняется и отправляется обратно на вход в этой сети. В результате узлы определенного слоя сохраняют некоторую информацию о предыдущих действиях. Сумма весов и характеристик определяет комбинацию входного слоя. Скрытые слои — это то место, где начинается процесс, основанный на rnn. Каждый узел здесь запоминает часть информации с предыдущего этапа. Модель сохраняет некоторые данные из каждой итерации, чтобы их можно было использовать позже. Когда результат системы неверен, она самообучается. Затем он использует эти знания для оптимизации точности своего прогноза обратного распространения. Технология преобразования текста в речь является наиболее распространенным применением RNN.
Как работает многослойный персептрон?
Название «многослойный персептрон» происходит от того факта, что нейронная сеть состоит из нескольких слоев персептрона. Эти слои также известны как плотные слои со скрытыми слоями. Они состоят из большого количества персептронных нейтронов. Они являются основными строительными блоками, из которых состоит уровень персептрона. Информация в наборе входов достигает этих нейронов. Эти числовые входные данные объединяются со смещением, а также с группой весов для получения единого результата.