Эволюция языкового моделирования в современной жизни

Опубликовано: 2020-03-04

Как языковое моделирование, задуманное в середине прошлого века, стало неотъемлемой частью искусственного интеллекта с практическим применением в современной жизни? Как эта смесь искусственного интеллекта и компьютерной лингвистики стала ядром нашего мира? Давайте рассмотрим концепцию обработки естественного языка (NLP) и ее популярные приложения, такие как чат-боты, голосовые команды и виртуальные помощники, такие как Google Assistant, Siri, Cortana и Amazon Alexa.

Оглавление

Что такое НЛП?

Проще говоря, НЛП помогает компьютерам понимать, интерпретировать и использовать человеческий язык, а также обеспечивает полное общение в более тонкой форме. НЛП опирается на различные дисциплины, включая лингвистику и информатику, и предоставляет компьютерам возможность читать текст, слышать речь и интерпретировать огромное количество данных. Он значительно эволюционировал с 1950-х годов и стал частью нашей повседневной жизни. Скорее всего, он продолжит предлагать стандартные и инновационные решения общих проблем, сокращая время, человеческие усилия и затраты.

История НЛП

Алан Тьюринг , теоретик компьютерных наук и эксперт по искусственному интеллекту, впервые задумал идею обработки естественного языка в 1950-х годах. Он написал статью, разъясняющую тест для машины, в которой заявил, что если машина может участвовать в разговоре с помощью телетайпа, то ее также можно научить подражать человеку. Повторяющиеся паттерны позволили бы машине научиться этому действию, после чего ее можно было бы считать способной к мышлению.

В 1954 году эксперимент Джорджтаунского университета и IBM был направлен на автоматический перевод шести русских предложений на английский, что посеяло надежду на то, что машинный перевод станет возможным в короткий промежуток времени. Однако только в конце 1980-х годов была разработана первая система статистического машинного перевода (переводы, созданные с помощью статистической модели). В период с 1950-х по 80-е годы был достигнут прогресс в создании других программ на естественном языке.

Из них ELIZA занимала центральное место в середине 1960-х. Это была компьютерная программа, разработанная Джозефом Вейценбаумом в Лаборатории искусственного интеллекта Массачусетского технологического института для выяснения поверхностности общения между людьми и машинами. Выяснилось, что общение с машинами не связано с контекстуализацией событий, а только следует сценарию. Тем не менее, пользователи приписали программе человеческие чувства. ELIZA проложила путь к тому, что мы теперь знаем как чат-боты (также известные как чат-боты), которые развивались с течением времени.

1970-е были десятилетием преобразования структурированной информации реального мира в данные, понятные компьютеру, и ряд программ улучшили доступные технологии. Известными из них были PARRY (чат-бот 1972 года с эмоциональными ответами), а позже Racter (насмешливый чат-бот, созданный в 1984 году) и Jabberwacky (чат-бот, созданный в 1988 году и предназначенный для имитации человеческого разговора в развлекательной форме).

1980-е годы были революционными в обработке естественного языка, когда для обработки языка использовались алгоритмы машинного обучения. Произошел всплеск вычислительной мощности и постепенное упрощение лингвистики. С деревьями решений, тегами речи и акцентом на статистические модели, языковые модели кэширования и распознавание речи результаты стали более надежными.

Первые успехи машинного обучения можно отнести к IBM Research, где последовательно разрабатывались более сложные статистические модели, включая перевод всех правительственных документов на все официальные языки Канады и Европейского Союза.

21 век принес с собой репрезентативное обучение (автоматическое изучение признаков) и методы машинного обучения в стиле глубоких нейронных сетей для достижения самых современных результатов. Это включает в себя встраивание слов для захвата семантики и вопросов и ответов более высокого уровня, порождая нейронный машинный перевод (NMT), который использует искусственную нейронную сеть для прогнозирования последовательности слов, моделируя все предложение в единой интегрированной модели.

За последние два десятилетия НЛП исследовало больше нейронных языковых моделей, многозадачное обучение, встраивание слов, более продвинутые нейронные сети, модели последовательностей, сети на основе памяти и предварительно обученные языковые модели. Это продвижение привело к появлению таких приложений, как интеллектуальные клавиатуры и предложения ответов по электронной почте для помощи машин с помощью речи.

Сейчас наблюдается неуклонный переход от обработки естественного языка (NLP) к пониманию естественного языка (NLU), когда пользователь, имеющий человеческую эмоциональную связь с машиной, не будет еретиком.

Кодирование против статистического НЛП

Первоначально системы языковой обработки разрабатывались путем ручного кодирования, в основном путем написания грамматики или разработки эвристических правил. Однако в середине 1980-х это изменилось на машинное обучение, которое использовало статистический вывод для автоматического изучения этих правил посредством анализа большого набора реальных примеров. Это привело к ощутимой разнице в скорости и понимании систем обработки языка.

Процедуры обучения, используемые во время машинного обучения, автоматически фокусировались на наиболее распространенных случаях. Они могли указывать и исправлять ошибочные входные данные, слова с ошибками и решать более сложные задачи с помощью алгоритмов. Это изменило правила игры и привело к сценарию, в котором НЛП можно было широко и успешно использовать в глобальном масштабе.

Это был долгий путь, чтобы достичь точки, где можно было бы использовать грамматическую индукцию, лемматизацию, морфологическую сегментацию, маркировку речи, синтаксический анализ, разбивку предложений, выделение корней, сегментацию слов и извлечение терминологии для создания надежных платформ для использования НЛП.

Применение НЛП в реальной жизни

1. Машинный перевод

НЛП создало несколько точек соприкосновения в нашей жизни, особенно в последнее десятилетие. Одним из самых популярных приложений является машинный перевод , более известный как Google Translate . Основываясь на SMT (статистическом машинном переводе, который относится к машинному переводу, созданному на основе статистических моделей), Google Translate не выполняет дословный перевод, а присваивает семантическое значение словам, чтобы переводить их связным образом.

Однако из-за присущей человеческому языку двусмысленности и гибкости такой перевод не совсем точен. Сказав это, Google Translate по-прежнему остается самым популярным инструментом, используемым для перевода во время путешествий, преодолевая языковой разрыв.

2. Распознавание речи

Еще один показательный и близкий пример НЛП. Программное обеспечение для распознавания речи позволяет декодировать человеческий голос, что может использоваться в мобильной телефонии, домашней автоматизации, вычислениях без помощи рук, виртуальной помощи, видеоиграх и многом другом. Самое популярное использование этого в нашей повседневной жизни произошло с появлением Google Assistant, Siri и Amazon Alexa .

Как это работает? В случае Google Assistant речь преобразуется в текст с помощью системы скрытой марковской модели (HMM). Система HMM прослушивает 10–20-миллисекундные фрагменты произнесенных слов, ищет фонемы и сравнивает их с предварительно записанной речью. Процесс понимания сопровождается определением языка и контекста.

Система разбивает каждое слово на его часть речи (существительное, глагол и т. д.), а затем определяет контекст ваших заказов. Затем он классифицирует эту команду и эффективно выполняет задачу. Alexa, с другой стороны, работает немного по-другому.

Каждый раз, когда вы что-то говорите, слова возвращаются на сервер Amazon для расшифровки. Система опирается на огромную базу данных слов и инструкций для оценки и выполнения команды. Например, если Alexa обнаружит такие слова, как «пицца» или «ужин», она откроет приложение для еды, а если обнаружит слово «воспроизведение», то подключится к параметрам музыки.

3. Анализ настроений

Говоря о НЛП, нельзя игнорировать анализ настроений . Это также известно как интеллектуальный анализ мнений или эмоциональный ИИ, который измеряет склонность мнений людей. Он предполагает выявление субъективной информации в тексте и имеет ряд приложений. Мониторинг бренда и управление репутацией — наиболее распространенное использование анализа настроений в отраслях.

Это позволяет компаниям отслеживать восприятие бренда, выявлять тенденции, следить за влиятельными лицами и их влиянием, отслеживать отзывы о продукте или услуге, искать новые идеи и варианты и соответствующим образом корректировать маркетинговые стратегии. Помимо восприятия бренда и мнения клиентов, исследование рынка является еще одной важной областью применения анализа настроений.

Создание и отслеживание пользовательского контента (обзоров), новостных статей, контента конкурентов и заполнение пробелов в информации о рынке часто являются подмножествами анализа настроений. Управление репутацией и анализ продуктов — еще одно приложение анализа настроений, которое используется в разных отраслях. Благодаря этому бренды могут получать подробные отзывы о своих продуктах.

Анализ настроений на основе аспектов — это еще один способ, с помощью которого бренды могут продуктивно использовать анализ настроений. Подход, основанный на аспектном анализе, позволяет выделить наиболее важные моменты, касающиеся отзывов клиентов. Учитывая эту богатую информацию и анализ, бренды могут настраивать, обновлять и направлять коммуникацию и вносить соответствующие изменения в продукт или услугу.

4. Виртуальные помощники

Виртуальная помощь с помощью более зрелых чат- ботов — современный подход к быстрому и эффективному общению с потребителями. Низкоприоритетные, но высокооборачиваемые задачи, не требующие навыков, можно легко решить с помощью чат-ботов. Доверие и популярность среди пользователей и разработчиков растут по мере того, как мы движемся к быстрой эволюции интеллектуальных чат -ботов , которые в ближайшем будущем будут предлагать персонализированную помощь клиенту.

Фактически, применение чат-ботов также подтолкнуло специалистов по маркетингу к более продуктивному использованию виртуальной помощи, создавая новые форматы рекламы и общения, которые подходят для программ чат-ботов.

5. Здравоохранение

В медицинском мире служба первичной медико-санитарной помощи на основе ИИ включает в себя решение многих задач НЛП. Некоторые из текущих вариантов использования НЛП в медицине включают извлечение различных медицинских сущностей, включая симптомы, заболевания или методы лечения, из большого объема информации.

Извлечение знаний из неструктурированных медицинских текстов для выявления закономерностей и взаимосвязей чрезвычайно полезно для медицинских работников. В той мере, в какой НЛП можно использовать для получения информации, его также можно использовать для передачи соответствующих ответов и создания функций автозаполнения для системы связи с медицинским обслуживанием.

6. Система электронной почты

В 2017 году Google запустила SmartReply , основанную на машинном обучении, позволяющую без особых усилий отвечать на электронные письма. Частью этого являются ускоренный набор текста, интеллектуальный ввод, проверка орфографии и грамматики. Smart Reply сканирует текст входящего сообщения и предлагает три основных ответа, которые пользователь может настроить и отправить, сокращая время, затрачиваемое на простые или обыденные ответы.

Это полностью основано на нейронных сетях, обученных анализировать сообщения и преобразовывать их в числовые коды, представляющие их значение. В системе электронной почты классификация электронной почты и обнаружение спама — это другие способы, с помощью которых НЛП упростило нашу жизнь.

7. Поисковое поведение

Поисковое поведение — еще один аспект НЛП, с которым мы сталкиваемся ежедневно. Поисковые системы используют NLP для отображения релевантных результатов на основе похожего поведения при поиске или намерений пользователей, поэтому средний пользователь легко находит то, что ему нужно. Например, Google не только предсказывает, какие популярные поисковые запросы могут относиться к запросу человека, когда он начинает вводить текст, но и всесторонне рассматривает всю картину, показывая релевантные косвенные результаты.

8. Цифровые телефонные звонки

Цифровые телефонные звонки могут показаться навязчивой частью дня, когда с вами разговаривает записанное голосовое маркетинговое сообщение, но это отличное средство для связи с большим количеством людей и быстрого решения проблем. НЛП позволяет использовать компьютерный язык, близкий к человеческому голосу, который может собирать информацию от потребителя и выполнять простые задачи, такие как передача информации и запись на прием.

9. Умные дома

Голосовые команды в автомобиле, такие как запирание дверей, опускание окон или воспроизведение определенной музыки, — это лишь некоторые из функций, которые НЛП задействует в автомобильной промышленности . В области автоматизации домашняя автоматизация также тесно связана с NLP, где голосовые команды для закрытия или открытия жалюзи, освещения и бытовой техники лежат в основе « умных домов».

Это лишь некоторые из многих применений НЛП, с которыми мы сталкиваемся в жизни. Точки соприкосновения находятся в мире бизнеса, личного развития, управления персоналом, продаж, обучения, медицины, телекоммуникаций, автомобилей, инфраструктуры, коучинга и многих других.

Что дальше?

NLP, хотя и все еще находится в зачаточном состоянии по сравнению с большими данными и глубоким обучением, широко считается будущим обслуживания клиентов. Он обещает сделать данные более удобными для пользователя и разговорными, что делает их основой бизнес-аналитики. Чат-боты, например, станут еще более совершенными и полезными благодаря способности декодировать сложные и длинные запросы в режиме реального времени.

Что, вероятно, изменится в отношении нынешних способностей НЛП, так это тонкое понимание языка. НЛП будущего позволит понять тонкости и тон языка и предоставит полезные знания и идеи, которые могут быть в сфере годовых отчетов, расшифровок телефонных разговоров, сообщений, важных для инвесторов, или юридических документов и документов по соблюдению нормативных требований.

Расширенное использование НЛП также можно увидеть в робототехнике, здравоохранении, финансовых услугах, автомобилестроении и инфраструктуре с точками соприкосновения в повседневном использовании. NLP будущего станет ядром аналитики для улучшения и развития бизнеса по всему миру.

Если вам интересно узнать больше об обработке естественного языка, ознакомьтесь с нашей программой «Диплом PG в области машинного обучения и искусственного интеллекта», которая предназначена для работающих профессионалов и содержит более 30 тематических исследований и заданий, более 25 отраслевых сессий наставничества, 5+ практических занятий. ключевые проекты, более 450 часов тщательного обучения и помощь в трудоустройстве в ведущих фирмах.

Подготовьтесь к карьере будущего

ДИПЛОМ PG В ОБЛАСТИ МАШИННОГО ОБУЧЕНИЯ И ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Узнать больше @ upGrad