Нейронные сети для чайников: подробное руководство

Опубликовано: 2018-02-07

Наш мозг — невероятная машина для распознавания образов. Он обрабатывает «входные данные» из внешнего мира, классифицирует их (это собака, это кусок пиццы, о, это автобус приближается ко мне!) эту пиццу; убирайся с пути автобуса!).
Все это с небольшим сознательным усилием, почти импульсивно. Это та же самая система, которая чувствует, злится ли кто-то на нас, или невольно замечает стоп-сигнал, когда мы проезжаем мимо него. Психологи называют этот способ мышления «Системой 1», и он включает врожденные навыки, такие как восприятие и страх, которые мы разделяем с другими животными. (Есть также «Система 2», чтобы узнать о ней больше, ознакомьтесь с чрезвычайно информативной книгой Дэниела Канемана «Думай быстро и медленно» ).
Как все это связано с нейронными сетями , спросите вы? Подожди, мы подойдем через секунду.
Нейронные сети для чайников — подробное руководство UpGrad Blog
Посмотрите на изображение выше, только ваши обычные числа, искаженные, чтобы помочь вам лучше объяснить изучение нейронных сетей . Даже бегло взглянув, ваш разум подскажет вам слова «192».
Вы, конечно, не подумали: «А, это похоже на прямую линию, я думаю, это 1». Вы не рассчитали — это произошло мгновенно.
Увлекательно, правда?
Этому есть очень простая причина — вы сталкивались с цифрой так много раз в своей жизни, что методом проб и ошибок ваш мозг автоматически распознает цифру, если вы предъявляете ему что-то хотя бы отдаленно близкое к ней.
В чем разница между наукой о данных, машинным обучением и большими данными?

Давайте перейдем к делу.

Оглавление

Что такое нейронная сеть ? Как это работает?

По определению, нейронная сеть — это система аппаратного или программного обеспечения, созданная по образцу работы нейронов в человеческом мозгу. По сути, это помогает компьютерам думать и учиться, как люди. Пример сделает это более понятным:
В детстве, если мы когда-либо прикасались к кружке с горячим кофе и обжигали нас, мы старались больше никогда не прикасаться к горячей кружке. Но было ли у нас такое представление о боли в нашей совести ДО того, как мы коснулись ее? Не совсем.
Эта корректировка наших знаний и понимания окружающего мира основана на распознавании закономерностей. И, как и мы, компьютеры тоже учатся с помощью того же типа распознавания образов. Это обучение составляет основу работы нейронных сетей .
Традиционные компьютерные программы работают на логических деревьях: если происходит А, то происходит Б. Все потенциальные результаты для каждой из систем могут быть запрограммированы заранее. Однако это сводит на нет возможности гибкости. Там нет обучения.
И здесь на помощь приходят нейронные сети ! Нейронная сеть строится без какой-либо определенной логики. По сути, это система, обученная искать закономерности в данных и адаптироваться к ним. Он смоделирован точно по тому, как работает наш собственный мозг. Каждый нейрон (идея) связан через синапсы. Каждый синапс имеет значение, которое представляет вероятность или вероятность возникновения связи между двумя нейронами. Взгляните на изображение ниже:
Нейронные сети для чайников — подробное руководство UpGrad Blog
Вы спросите, что такое нейроны?
Проще говоря, нейрон — это просто единичное понятие. Кружка, цвет белый, чай - жжение от прикосновения к горячей кружке, в общем, что угодно. Все это возможные нейроны. Все они могут быть связаны, и сила их связи определяется значением их синапса. Чем выше значение, тем лучше соединение. Давайте посмотрим на одно базовое подключение к нейронной сети , чтобы вы лучше поняли:
Нейронные сети для чайников — подробное руководство UpGrad Blog
Каждый нейрон является узлом, а линии, соединяющие их, — синапсами. Значение синапса представляет собой вероятность того, что один нейрон будет найден рядом с другим. Итак, совершенно ясно, что диаграмма, показанная на изображении выше, описывает кружку с кофе, которая имеет белый цвет и очень горячая.
Генерация естественного языка: главное, что вам нужно знать

Не все кружки обладают такими свойствами, как рассматриваемая. Мы можем подключить много других нейронов к кружке. Чай, например, вероятно, более распространен, чем кофе. Вероятность соединения двух нейронов определяется силой синапса, соединяющего их. Чем больше горячих кружек, тем сильнее синапс.
Однако в мире, где кружки не используются для хранения горячих напитков, количество горячих кружек резко сократится. Между прочим, это снижение также привело бы к снижению силы синапсов, соединяющих кружки с теплом.
Так,
Нейронные сети для чайников — подробное руководство UpGrad Blog
становится

Это небольшое и, казалось бы, неважное описание кружки представляет собой основную конструкцию нейронных сетей .
Трогаем стоящую на столе кружку — обнаруживаем, что она горячая. Это заставляет нас думать, что все кружки горячие. Затем дотрагиваемся до другой кружки – на этот раз той, что стоит на полке – она совсем не горячая. Делаем вывод, что кружки на полке не горячие. По мере того, как мы растем, мы развиваемся.
Наш мозг все это время собирал данные. Эти данные позволяют определить точную вероятность того, будет ли кружка, к которой мы собираемся прикоснуться, горячей. Нейронные сети учатся точно так же.
Теперь давайте немного поговорим о первой и самой базовой модели нейронной сети : перцептроне!

Что такое Персептрон?

Персептрон — это самая базовая модель нейронной сети. Он принимает несколько двоичных входов: x1, x2, … и выдает один двоичный выход.
Нейронные сети для чайников — подробное руководство UpGrad Blog
Давайте лучше поймем приведенную выше нейронную сеть с помощью аналогии.
Скажем, вы идете на работу пешком. Ваше решение пойти на работу основывается главным образом на двух факторах: на погоде и на том, будний ли это день или нет. С погодным фактором еще можно справиться, а вот работать по выходным — нет! Поскольку нам приходится работать с бинарными входными данными, давайте предложим условия в виде вопросов «да» или «нет». Погода хорошая? 1 за да, 0 за нет. Это будний день? 1 да, 0 нет.
Руководство для начинающих по пониманию естественного языка

Помните, что мы не можем явно сообщить нейронной сети об этих условиях; он должен будет изучить их для себя. Как он будет определять приоритет этих факторов при принятии решения? С помощью чего-то, известного как «веса». Веса — это просто числовое представление предпочтений. Более высокий вес заставит нейронную сеть рассматривать этот ввод с более высоким приоритетом, чем другие. Это представлено w1, w2… на блок-схеме выше.
«Хорошо, все это довольно увлекательно, но где нейронные сети находят применение в практическом сценарии?»

Реальные приложения нейронных сетей

Если вы еще не поняли, то вот, нейронная сеть может делать почти все, если вы можете получить достаточно данных и эффективную машину для получения правильных параметров. Все, что хотя бы отдаленно требует машинного обучения, обращается за помощью к нейронным сетям . Глубокое обучение — еще одна область, в которой широко используются нейронные сети. Это один из многих алгоритмов машинного обучения, который позволяет компьютеру выполнять множество задач, таких как классификация, кластеризация или прогнозирование.

С помощью нейронных сетей мы можем найти решение таких задач, для которых традиционно-алгоритмический метод дорог или не существует.
Нейронные сети могут учиться на примерах, поэтому нам не нужно в значительной степени программировать их.
Нейронные сети точны и значительно быстрее, чем обычные скорости.

Следите за следующей большой вещью: машинное обучение

По причинам, упомянутым выше и многим другим, глубокое обучение с использованием нейронных сетей находит широкое применение в следующих областях:

Распознавание речи: Возьмем, к примеру, Amazon Echo Dot — волшебные динамики, которые позволяют вам заказывать еду, получать новости и обновления погоды или просто покупать что-то в Интернете, просто говоря это.
Распознавание почерка: нейронные сети можно научить понимать закономерности чьего-то почерка. Взгляните на приложение Google для рукописного ввода, которое использует распознавание рукописного ввода для беспрепятственного преобразования ваших каракулей в осмысленные тексты.
Распознавание лиц: от улучшения безопасности на вашем телефоне (Face ID) до суперкрутых фильтров Snapchat — распознавание лиц есть везде. Если вы когда-нибудь загружали фотографию на Facebook и вас просили отметить людей на ней, вы знаете, что такое распознавание лиц!
Обеспечение искусственного интеллекта в играх. Если вы когда-либо играли в шахматы против компьютера, вы уже знаете, как искусственный интеллект влияет на игры и разработку игр. В той мере, в какой игроки используют ИИ, чтобы улучшить свою тактику и опробовать свои стратегии на собственном опыте .

В заключение…
Нейронные сети составляют основу почти каждой крупной технологии или изобретения, которое вы видите сегодня. Справедливо будет сказать, что представить себе глубокое/машинное обучение без нейронных сетей практически невозможно. В зависимости от того, как вы реализуете сеть и какое обучение вы используете, вы можете многого добиться от нейронной сети по сравнению с традиционной компьютерной системой.

Изучайте курсы машинного обучения в лучших университетах мира. Заработайте программы Masters, Executive PGP или Advanced Certificate Programs, чтобы ускорить свою карьеру.

Чем глубокое обучение отличается от нейронных сетей?

Глубокое обучение — это ветвь машинного обучения, тогда как нейронные сети состоят из различных алгоритмов машинного обучения. В то время как нейронные сети используют нейроны для передачи данных в виде входных и выходных значений через соединения, глубокое обучение связано с преобразованием и извлечением признаков, что, таким образом, направлено на построение взаимосвязи между стимулами и соответствующими нейронными реакциями, существующими в мозгу.

Каковы некоторые ограничения нейронных сетей?

Одним из недостатков использования нейронных сетей является необходимость большого количества данных, что является одним из недостатков. Кроме того, по сравнению со стандартными методами использование нейронных сетей требует значительных вычислительных ресурсов. Одна из основных проблем заключается в том, что нейронные сети не дают хорошего объяснения выводам, которые они производят. Это можно наблюдать на таких сайтах, как Quora, где при аннулировании учетной записи пользователя не может быть дано четкого объяснения, почему предоставленный им ответ был неверным.

Как машинное обучение справляется с двусмысленностью?

ML включает в себя широкий спектр типов данных, таких как фотографии, видео, сценарии и т. д. Несмотря на сложность, алгоритмы машинного обучения, такие как обработка естественного языка и секвенирование ДНК, дают ответы на неоднозначные вопросы. Неоднозначность будет уменьшена только в том случае, если будут использоваться более качественные данные. Кроме того, идеализированная цель машинного обучения должна быть точной и соответствовать потребностям рассматриваемого проекта машинного обучения.