Как работает неконтролируемое машинное обучение?
Опубликовано: 2018-06-13Неконтролируемое обучение относится к обучению системы ИИ с использованием информации, которая не классифицирована и не помечена. В идеале это означает, что алгоритм должен действовать на основе информации без каких-либо предварительных указаний.
При неконтролируемом обучении машина группирует несортированную/неупорядоченную информацию о сходствах и различиях. Это делается без указания категорий, по которым машина может классифицировать данные. Системы, использующие такое обучение, обычно связаны с генеративной моделью обучения.
Оглавление
Как работает неконтролируемое машинное обучение?
При неконтролируемом обучении система ИИ представлена немаркированными, некатегоризированными данными, и алгоритмы системы воздействуют на данные без предварительного обучения. Результат зависит от закодированных алгоритмов. Подвергнуть систему обучению без учителя — это общепринятый способ проверки возможностей этой системы.
Алгоритмы обучения без учителя могут выполнять более сложные задачи обработки, чем системы обучения с учителем. Однако обучение без учителя может быть более непредсказуемым, чем альтернативная модель. Система, обученная с использованием неконтролируемой модели, могла бы, например, самостоятельно выяснить, как различать кошек и собак, она также могла бы добавить неожиданные и нежелательные категории для работы с необычными породами, которые могли бы в конечном итоге загромождать вещи вместо того, чтобы держать их в порядке. заказ.
Для алгоритмов обучения без учителя система ИИ представлена немаркированным и неклассифицированным набором данных. Следует иметь в виду, что эта система не прошла никакого предварительного обучения. По сути, неконтролируемое обучение можно рассматривать как обучение без учителя.
В случае обучения с учителем система имеет как входы, так и выходы. Таким образом, в зависимости от разницы между желаемым результатом и наблюдаемым результатом система настроена на обучение и улучшение. Однако в случае неконтролируемого обучения система имеет только входы и не имеет выходов.
Что такое машинное обучение и почему это важно
Неконтролируемое обучение чрезвычайно полезно при выполнении задач, связанных с интеллектуальным анализом данных и извлечением признаков. Конечная цель неконтролируемого обучения — обнаружить скрытые тенденции и закономерности в данных или выделить нужные функции. Как мы уже говорили ранее, неконтролируемое обучение имеет дело только с набором входных данных без каких-либо предварительных знаний или обучения. Таким образом, существует два типа обучения без учителя:
Параметрическое обучение без учителя
Параметрическое обучение без учителя предполагает параметрическое распределение данных. Это означает, что этот тип обучения без учителя предполагает, что данные поступают из совокупности, которая следует определенному распределению вероятностей на основе некоторых параметров. Теоретически, если мы рассмотрим нормальное распределение семейства объектов, то увидим, что все члены имеют сходные характеристики и всегда параметризованы средним значением и стандартным отклонением. Это означает, что если мы знаем среднее значение и стандартное отклонение, и если распределение нормальное, то мы можем очень легко узнать вероятность будущих наблюдений. Параметрическое обучение без учителя намного сложнее, чем стандартное обучение с учителем, потому что нет доступных меток; следовательно, нет предопределенной меры точности для проверки выходных данных.
Непараметрическое обучение без учителя
Непараметрическое обучение без учителя относится к кластеризации набора входных данных. Каждый кластер, по сути, что-то говорит о категориях и классах элементов данных, присутствующих в наборе. Это наиболее часто используемый метод моделирования данных и анализа данных с малыми размерами выборки. Эти методы также называются методами без распределения, потому что, в отличие от параметрического обучения, разработчику моделей не нужно делать никаких предположений о распределении всей совокупности.
Эти 6 методов машинного обучения улучшают здравоохранение
На этом этапе важно немного углубиться в то, что мы подразумеваем под кластеризацией.
Итак, что такое кластеризация?
Кластеризация является одной из наиболее важных базовых концепций, когда речь идет об обучении без учителя. Он имеет дело с поиском структуры или шаблона в наборе неклассифицированных данных. Простым определением кластера может быть «процесс группировки объектов в классы таким образом, что каждый член класса похож на другой тем или иным образом».
Следовательно, кластер можно просто определить как набор объектов данных, которые «похожи» между кластером и «не похожи» на объекты другого кластера.

Приложения неконтролируемого машинного обучения
Цель неконтролируемого машинного обучения — выявить ранее скрытые закономерности и тенденции в данных. Но в большинстве случаев шаблоны данных являются плохим приближением к тому, чего может достичь контролируемое машинное обучение — например, они сегментируют клиентов на большие группы, а не рассматривают их как отдельных лиц и обеспечивают высоко персонализированные коммуникации. В случае обучения без учителя мы не знаем, каков будет результат, и, следовательно, если нам нужно разработать прогностическую модель, обучение с учителем имеет больше смысла в контексте реального мира.
Идеальный вариант использования неконтролируемого машинного обучения — это когда у вас нет данных о желаемых результатах. Например, если вам нужно определить целевой рынок для совершенно нового продукта. Однако, если вы хотите лучше классифицировать свою потребительскую базу, обучение с учителем — лучший вариант.
5 прорывных приложений машинного обучения
Давайте рассмотрим некоторые приложения неконтролируемых методов машинного обучения:

- Неконтролируемое обучение чрезвычайно полезно для обнаружения аномалий в вашем наборе данных. Обнаружение аномалий относится к поиску важных точек данных в вашей коллекции данных. Это очень удобно для обнаружения мошеннических транзакций, обнаружения сломанных частей оборудования или выявления любых выбросов, которые могли появиться во время ввода данных.
- Интеллектуальный анализ ассоциаций означает идентификацию набора элементов, которые встречаются вместе в наборе данных. Это весьма полезный метод для анализа корзины, поскольку он позволяет аналитикам обнаруживать товары, которые часто покупаются вместе. Анализ ассоциаций невозможен без кластеризации данных, а когда вы говорите о кластеризации, вы говорите об алгоритме машинного обучения без присмотра.
- Еще одним вариантом использования неконтролируемого обучения является уменьшение размерности. это относится к уменьшению количества функций в наборе данных и, таким образом, к лучшей предварительной обработке данных. Для этой цели обычно используются модели со скрытыми переменными, которые становятся возможными только благодаря использованию алгоритмов обучения без учителя.
Паттерны и тенденции, обнаруженные с помощью обучения без учителя, также могут пригодиться при дальнейшем применении алгоритмов обучения с учителем — например, обучение без учителя может помочь вам выполнить кластерный анализ набора данных, а затем вы можете использовать обучение с учителем в любом кластере по вашему выбору. нужно.
Инженеры по машинному обучению: мифы против реальности
В общем, машинное обучение и искусственный интеллект — невероятно сложные области, и любая сложная система ИИ, с которой вы столкнетесь, скорее всего, будет использовать комбинацию различных алгоритмов и механизмов обучения. Сказав это, если вы новичок, крайне важно, чтобы вы знали ключевые моменты, связанные со всеми основными методами обучения.

Изучайте курсы машинного обучения в лучших университетах мира. Заработайте программы Masters, Executive PGP или Advanced Certificate Programs, чтобы ускорить свою карьеру.
Мы надеемся, что смогли прояснить более тонкие моменты алгоритма обучения без учителя. Если у вас есть сомнения, пожалуйста, оставьте их в комментариях ниже!
Упомяните некоторые ограничения неконтролируемого машинного обучения.
В случае неконтролируемого машинного обучения может потребоваться вмешательство человека, чтобы уловить разнообразные шаблоны и связать их с опытом предметной области, что может быть дорогостоящим. Результаты или результаты часто оказываются неточными. Сортировка и вывод неконтролируемой задачи не могут быть точно определены. Сильно зависит от модели и, как следствие, от машины. Кроме того, неизвестно общее количество курсов. В результате выводы анализа трудно проверить.
Каково правило ассоциации в неконтролируемом машинном обучении?
Правило ассоциации — это один из нескольких неконтролируемых методов машинного обучения. Вы можете создавать отношения между элементами данных в огромных базах данных, используя правила ассоциации. Обнаружение интригующих корреляций между переменными в массивных базах данных является целью этого неконтролируемого подхода/алгоритма. Ассоциативное правило представляет собой набор подходов, которые используются в качестве отличной основы для создания всевозможных прогнозов и оценки вероятности того, что одни события произойдут по сравнению с другими.