Что такое байесовские нейронные сети? Предыстория, основная идея и функция

Опубликовано: 2020-12-23

Оглавление

Введение
История байесовской нейронной сети
Основная идея байесовской нейронной сети
Что такое байесовские нейронные сети?
Как работают байесовские нейронные сети (BNN)?
Заключение
Как сделать графическую модель из байесовской сети?
Какова связь между байесовской сетью и вероятностью?
Назовите какое-либо одно предположение, которое делают байесовские сети?

Введение

В этой статье рассматривается фундаментальная концепция байесовских нейронных сетей. Эта конкретная концепция байесовских нейронных сетей вступает в игру, когда невидимые данные вводятся в нейронную сеть, создавая неопределенность.

Мера этой неопределенности в прогнозе, которая отсутствует в архитектурах нейронных сетей, объясняется байесовскими нейронными сетями. Он решает проблему переобучения, но также помогает в дополнительных функциях, таких как оценка неопределенности и распределение вероятностей. Также была объяснена концепция нейронных сетей.

Читайте: Типы контролируемого обучения

История байесовской нейронной сети

Сравнивая одну из самых эффективных систем искусственного интеллекта за последние десять лет, все эти машины имеют одну общую черту — они используют сложную технику, называемую глубоким обучением.

Раскрывая концепцию глубокого обучения, можно заметить, что это название позволило использовать относительно новый подход к искусственному интеллекту, называемый нейронными сетями, который непоследовательно находится в тренде уже более 70 лет. В качестве примера замечено, что концепция нейронных сетей смутно основана на человеческом мозге, который состоит из миллионов узлов обработки, соединенных в плотную сеть так же, как переплетенные провода.

Таким образом, байесовские нейронные сети удобно решают проблему неопределенностей в обучающих данных, поступающих таким образом.

Основная идея байесовской нейронной сети

Нейронные сети, более известные как нейронные сети, представляют собой эффективный способ машинного обучения, при котором компьютер изучает, анализирует и выполняет задачи, анализируя обучающие примеры. Используемые примеры в основном заранее помечены вручную. Например, возьмем систему распознавания объектов.

Информация о помеченных изображениях автомобилей, автомобилей, домов или любого объекта дается или подается. Затем он формулирует логический вывод в виде визуального шаблона, вставленного в виде данных, которые должны последовательно коррелировать с другими конкретными метками.

Архитекторы, работающие с нейронными сетями, одержали победу в анализе и изучении очень сложных входных и выходных отображений данных. Тем не менее, базовые знания об одной и той же системе отображения входных и выходных данных обычно заканчиваются тем, что не удовлетворяют большинству ситуаций, особенно когда есть необходимость интеграции убеждений конкретной модели или в обстоятельствах, когда данные ограничены.

Байесовские нейронные сети — это те критерии или параметры, которые в большинстве случаев выражаются как распределение и обычно изучаются с помощью концепции байесовского вывода по сравнению с детерминированным значением. У них есть внутренняя способность усваивать сложную нелинейную функцию из данных, а затем выражать неопределенности — и то, и другое одновременно. Следовательно, это также привело их к более высокой роли в стремлении собрать и создать более надежный и компетентный ИИ.

Обязательно прочтите: Типы регрессионных моделей в машинном обучении

Что такое байесовские нейронные сети?

Следовательно, байесовская нейронная сеть относится к расширению стандартной сети относительно предыдущего вывода. Байесовские нейронные сети оказываются чрезвычайно эффективными в определенных условиях, когда неопределенность высока и абсолютна. Этими обстоятельствами являются именно система принятия решений, или с относительно более низкими параметрами данных, или любой вид обучения на основе моделей.

Глубокие нейронные сети (DNN), как правило, формулируют логический вывод с заданными данными, не имея никакого предварительного опыта работы с набором данных. В результате они исключительно хорошо работают с нелинейными по своей природе данными и, следовательно, требуют большого объема данных только для целей обучения. Из-за загрузки дополнительной информации возникает проблема переобучения поверхностей.

Затруднение, возникающее в настоящей ситуации, заключается в том, что нейронные сети, как уже отмечалось ранее, работают исключительно хорошо с данными, которые подаются исключительно для целей обучения, но имеют тенденцию к снижению производительности, когда в систему подаются новые и чужие данные. Это приводит к тому, что Сети не видят определенных неопределенностей в самих обучающих данных, что приводит к их чрезмерной уверенности в своих прогнозах, которые могут вводить в заблуждение. Поэтому, чтобы избавиться от подобных ошибок, используются байесовские нейронные сети.

Как работают байесовские нейронные сети (BNN)?

Основная цель и идея байесовских нейронных сетей заключается в том, что каждая единица связана с распределением вероятностей, которое включает в себя веса и смещения.

Они известны как случайные переменные, которые будут предоставлять совершенно разные значения каждый раз, когда к ним обращаются.

Возьмем пример, если X является переменной и является полностью случайной величиной, представляет собой нормальное распределение. При каждом доступе к X дается расходящееся значение X. Процесс получения расходящегося значения каждый раз, когда извлекается значение X, называется выборкой. Значение, полученное из каждой выборки, зависит от распределения вероятностей.

По мере увеличения диапазона распределения вероятности неопределенность прямо пропорциональна; в результате он также повышается. Как правило, в нейронной сети каждый слой должен иметь фиксированные веса со смещениями, которые обычно учитывают выходные данные. С другой стороны, байесовская сеть будет иметь распределение вероятностей, которое будет привязано к самому слою.

Каждый раз выполняется многократный прямой проход с новым набором весов, а также смещений. Следовательно, он используется для решения вопроса классификации. Выход предоставляется для каждого прохода, сделанного в прямом направлении. Данные, загружаемые в качестве входного изображения, приводят к повышенной неопределенности. В таком случае это изображение, которое сеть ранее не встречала для выходных классов.

Заключение

Можно с уверенностью заключить, что байесовские нейронные сети — это благословение, когда дело доходит до интеграции и работы с неопределенностями. Они также проявились для улучшения прогнозирования.

Основные фундаментальные проблемы, возникающие при разработке байесовской нейронной сети или любой модели, основанной на вероятности, — это неразрешимые вычисления предыдущего распределения и соответствующих им ожиданий. Кроме того, исключительно ясно, что проблема переобучения очень надежно решается байесовскими сетями.

Если вам интересно узнать больше о машинном обучении, ознакомьтесь с дипломом PG IIIT-B и upGrad в области машинного обучения и искусственного интеллекта, который предназначен для работающих профессионалов и предлагает более 450 часов тщательного обучения, более 30 тематических исследований и заданий, IIIT- Статус B Alumni, более 5 практических практических проектов и помощь в трудоустройстве в ведущих фирмах.

Как сделать графическую модель из байесовской сети?

Связав все узлы, участвующие в каждом компоненте, байесовскую сеть можно превратить в неориентированную графическую модель. Это требует присоединения родителей каждого узла. Моральный граф — это неориентированный граф, соответствующий определенной байесовской сети. Вычисление морального графа является первым этапом многих методов вычисления байесовских сетей.

Какова связь между байесовской сетью и вероятностью?

Байесовская сеть создается с использованием ациклического ориентированного графа. Байесовская нейронная сеть — это вероятностная модель, которая учитывается путем применения одного условного распределения вероятностей для каждой переменной данной модели. Распределение основано на родителях на графике. Переменные в графе, которые разделены, по-прежнему независимы, но разделение базового графа неориентированного графа заменено более сложным d-разделением, которое учитывает влияние конкурирующих объяснений наблюдаемых значений.

Назовите какое-либо одно предположение, которое делают байесовские сети?

Когда нам предоставляется целевая классификация, критическим допущением для наивных байесовских классификаторов является то, что все значения переменных являются условно независимыми. Это предположение значительно помогает упростить вычисления целевой функции с точки зрения апостериорной вероятности. Однако для некоторых приложений, таких как текстовые документы и речевые сигналы, это предположение может оказаться неверным. Байесовские сети доверия могут быть полезным выбором в этом сценарии. Они используют набор условно независимых вероятностей, а не налагают все возможные значения на все переменные.