현대 생활에서 언어 모델링의 진화

게시 됨: 2020-03-04

20세기 중반에 구상된 언어 모델링은 어떻게 현대 생활에 실제 적용되는 인공 지능의 필수적인 부분이 되었습니까? 인공 지능과 컴퓨터 언어학의 결합은 어떻게 우리 세계의 핵심이 되었습니까? 자연어 처리(NLP)의 개념과 챗봇, 음성 내 명령 및 Google Assistant, Siri, Cortana 및 Amazon의 Alexa와 같은 가상 비서와 같은 인기 있는 응용 프로그램을 따라 여행해 봅시다.

NLP 란 무엇입니까?

간단히 말해서 NLP는 컴퓨터가 인간의 혀를 이해하고 해석하고 활용할 수 있도록 돕고 보다 미묘한 방식으로 완전한 의사 소통을 가능하게 합니다. NLP는 언어학 및 컴퓨터 과학을 포함한 다양한 분야에서 파생되며 컴퓨터에 텍스트를 읽고, 말하고, 방대한 양의 데이터를 해석할 수 있는 능력을 제공합니다. 1950년대 이후 광범위하게 진화하여 우리 일상 생활의 일부가 되었습니다. 일반적인 문제에 대한 표준 및 혁신적인 솔루션을 계속 제공하여 시간, 인력 및 비용을 절감할 것입니다.

NLP의 역사

이론적인 컴퓨터 과학 및 인공 지능 전문가인 Alan Turing 은 1950년대에 자연어 처리에 대한 아이디어를 처음 고안했습니다. 그는 기계에 대한 테스트를 설명하는 논문을 썼는데, 기계가 텔레프린터를 사용하여 대화의 일부가 될 수 있다면 인간을 모방하는 방법도 가르칠 수 있다고 말했습니다. 반복된 패턴을 통해 기계는 이 행동을 학습할 수 있으며, 그 후에 생각할 수 있는 것으로 간주될 수 있습니다.

1954년, 조지타운 대학과 IBM 의 실험은 6개의 러시아어 문장을 영어로 자동 번역하기 위해 노력했고, 짧은 시간 안에 기계 번역이 가능할 것이라는 희망의 씨앗을 뿌렸습니다. 그러나 1980년대 후반이 되어서야 최초의 통계 기계 번역 시스템 (통계 모델을 통해 생성된 번역)이 개발되었습니다. 1950년대에서 80년대에 걸쳐 다른 자연어 프로그램을 구축하는 데 진전이 있었습니다.

그 중 ELIZA 는 1960년대 중반에 중심 무대를 차지했습니다. 이것은 MIT 인공지능 연구소에서 Joseph Weizenbaum이 인간과 기계 간의 통신의 피상성을 밝히기 위해 개발한 컴퓨터 프로그램입니다. 그것은 기계와의 통신이 상황화 이벤트를 포함하지 않고 스크립트를 따랐다는 것을 보여주었습니다. 그러나 사용자는 프로그램에 인간의 감정을 돌렸다. ELIZA는 우리가 현재 알고 있는 챗봇 (채터봇이라고도 함)을 위한 길을 열었으며 시간이 지나면서 진화했습니다.

1970년대는 구조화된 실세계 정보를 컴퓨터가 이해할 수 있는 데이터로 만드는 10년이었고, 사용 가능한 기술에 대한 많은 프로그램이 개선되었습니다. 주목할만한 예로는 PARRY (감정적 반응이 있는 1972년 챗봇) 와 이후에 Racter (1984년에 만들어진 혀로 장난치는 챗봇) 와 Jabberwacky (1988년에 고안된 챗봇으로 재미있는 방식으로 인간 대화를 시뮬레이션하는 것을 목표로 함)가 있습니다.

1980년대는 기계 학습 알고리즘이 언어 처리에 사용되었던 자연어 처리에 있어 혁명적이었습니다. 계산 능력의 급증과 언어학의 점진적 단순화가 있었습니다. 의사 결정 트리, 음성 태깅 및 통계 모델, 캐시 언어 모델 및 음성 인식에 중점을 두어 결과의 신뢰성이 더욱 높아졌습니다.

머신 러닝의 초기 성공은 모든 정부 절차를 캐나다와 유럽 연합의 모든 공식 언어로 번역하는 것을 포함하여 더 복잡한 통계 모델이 연속적으로 개발된 IBM Research에 기인할 수 있습니다.

21 세기 에는 표현 학습 (자동 기능 학습)과 심층 신경망 스타일의 기계 학습 방법이 도입되어 최첨단 결과를 달성했습니다. 여기에는 의미론과 상위 수준 질문 및 답변을 캡처하기 위한 단어 임베딩이 포함되며 , 인공 신경망을 사용하여 단어 시퀀스를 예측하고 단일 통합 모델에서 전체 문장을 모델링하는 신경 기계 번역 (NMT) 이 탄생합니다 .

지난 20년 동안 NLP는 더 많은 신경 언어 모델, 다중 작업 학습, 단어 임베딩, 고급 신경망, 시퀀스 대 시퀀스 모델, 메모리 기반 네트워크 및 사전 훈련된 언어 모델을 탐구했습니다. 이러한 발전으로 인해 지능형 키보드 및 기계의 음성 지원 지원에 대한 이메일 응답 제안과 같은 애플리케이션이 탄생했습니다.

이제 자연어 처리(NLP)에서 자연어 이해(NLU)로의 꾸준한 움직임이 있습니다. 여기서 사용자는 기계와 인간의 감정적 연결을 갖는 것이 이단적이지 않을 것입니다.

코딩 대 통계 NLP

초기에 언어 처리 시스템은 본질적으로 문법을 작성하거나 발견적 규칙을 고안하여 손으로 코딩하여 설계되었습니다. 그러나 1980년대 중반에 이것은 통계적 추론을 사용하여 실제 세계의 많은 예를 분석하여 이러한 규칙을 자동으로 학습하는 기계 학습으로 변경되었습니다. 그 결과 언어 처리 시스템의 속도와 이해도에서 눈에 띄는 차이가 나타났습니다.

기계 학습 중에 사용되는 학습 절차는 가장 일반적인 경우에 자동으로 초점을 맞춥니다. 그들은 잘못된 입력, 철자가 틀린 단어를 지적하고 수정하고 알고리즘을 통해 더 복잡한 작업을 처리할 수 있습니다. 이것은 게임 체인저였으며 NLP가 전 세계적으로 광범위하고 성공적으로 사용될 수 있는 시나리오에 도달했습니다.

문법 유도, 표제어 분류, 형태학적 분할, 음성 태깅, 구문 분석, 문장 분리, 형태소 분석, 단어 분할 및 용어 추출을 사용하여 NLP를 사용하기 위한 강력한 플랫폼을 만들 수 있는 지점에 도달하는 것은 긴 여정이었습니다.

실생활에서의 NLP 응용

1. 기계 번역

NLP는 특히 지난 10년 동안 우리 삶의 여러 접점을 개발했습니다. 가장 인기 있는 응용 프로그램 중 하나는 Google 번역 으로 가장 잘 알려진 기계 번역 입니다. Google 번역은 SMT(통계적 모델을 기반으로 생성된 기계 번역)를 기반으로 단어 대 단어 번역을 수행하지 않고 단어에 의미 값을 부여하여 일관성 있게 번역합니다.

그러나 인간 언어의 고유한 모호성과 유연성으로 인해 그러한 번역은 완전히 정확하지 않습니다. 그럼에도 불구하고 Google 번역은 여전히 여행 중 번역에 가장 많이 사용되는 도구로 언어 격차를 해소합니다.

2. 음성 인식

NLP의 또 다른 예시적이고 관련 있는 예입니다. 음성 인식 소프트웨어 프로그램을 사용하면 이동 전화, 홈 자동화, 핸즈프리 컴퓨팅, 가상 지원, 비디오 게임 등에 사용할 수 있는 사람의 음성을 디코딩할 수 있습니다. 우리의 일상 생활에서 이것을 가장 많이 사용하는 것은 Google Assistant, Siri 및 Amazon의 Alexa 의 출현과 함께 이루어 졌습니다.

어떻게 작동합니까? Google Assistant의 경우 HMM(Hidden Markov Model) 시스템을 사용하여 음성을 텍스트로 변환합니다. HMM 시스템은 10~20밀리초 분량의 구어 클립을 듣고 음소를 검색하여 미리 녹음된 음성과 비교합니다. 이해의 과정은 언어와 맥락을 확인하는 것입니다.

시스템은 각 단어를 품사(명사, 동사 등)로 나눈 다음 주문의 맥락을 결정합니다. 그런 다음 이 명령을 분류하고 작업을 효과적으로 실행합니다. 반면 Alexa는 약간 다르게 작동합니다.

당신이 무언가를 말할 때마다 그 단어는 해독을 위해 아마존 서버로 돌아갑니다. 이 시스템은 명령을 평가하고 실행하기 위해 방대한 단어와 명령 데이터베이스에 의존합니다. 예를 들어 Alexa가 '피자' 또는 '저녁 식사'와 같은 단어를 감지하면 음식 앱을 열고 '재생'이라는 단어를 감지하면 음악 옵션에 연결합니다.

3. 감정 분석

NLP를 말할 때 감성 분석 을 무시할 수 없습니다. 이를 오피니언 마이닝 또는 감정 AI라고도 하며 사람들의 의견 성향을 측정합니다. 여기에는 텍스트에서 주관적인 정보를 식별하는 것이 포함되며 여러 응용 프로그램이 있습니다. 브랜드 모니터링 및 평판 관리는 업계에서 감정 분석을 가장 일반적으로 사용합니다.

이를 통해 기업은 브랜드에 대한 인식을 추적하고, 트렌드를 식별하고, 인플루언서와 영향력에 대해 귀를 기울이고, 제품 또는 서비스에 대한 리뷰를 모니터링하고, 새로운 아이디어와 변형을 발굴하고, 그에 따라 마케팅 전략을 조정할 수 있습니다. 브랜드 인식 및 고객 의견 외에도 시장 조사는 감성 분석 응용 프로그램의 또 다른 두드러진 분야입니다.

사용자 생성 콘텐츠(리뷰), 뉴스 기사, 경쟁자 콘텐츠의 생성 및 추적, 시장 정보의 격차 해소는 종종 감정 분석의 하위 집합입니다. 평판 관리 및 제품 분석은 업계 전반에 걸쳐 사용되는 감성 분석의 또 다른 응용 프로그램입니다. 이를 통해 브랜드는 제품에 대한 미묘한 피드백을 얻을 수 있습니다.

측면 기반 감정 분석은 브랜드가 감정 분석을 생산적으로 사용할 수 있는 또 다른 방법입니다. 측면 기반 분석 접근 방식을 통해 고객 피드백과 관련하여 가장 실행 가능한 포인트를 추출할 수 있습니다. 이러한 풍부한 정보와 분석을 바탕으로 브랜드는 수정하고, 새로고침하고, 커뮤니케이션을 지시하고 그에 따라 제품이나 서비스를 변경할 수 있습니다.

4. 가상 비서

보다 성숙한 챗봇 을 통한 가상 지원은 소비자와의 빠르고 효과적인 커뮤니케이션을 위한 현대적인 접근 방식입니다. 기술이 필요 없는 우선순위는 낮지만 이직률이 높은 작업을 챗봇을 통해 쉽게 제공할 수 있습니다. 가까운 장래에 고객에게 개인화된 지원을 제공할 지능형 챗봇 의 급속한 진화로 나아가면서 사용자와 개발자 사이에 신뢰와 인기가 높아 졌습니다.

실제로 챗봇의 적용으로 인해 마케팅 전문가는 가상 지원을 보다 생산적으로 사용하여 챗봇 프로그램에 맞는 새로운 형식의 광고 및 커뮤니케이션을 만들었습니다.

5. 의료

의료 세계에서 AI 기반 1차 진료 서비스에는 많은 NLP 작업을 해결하는 것이 포함됩니다. 의학에서 NLP 의 현재 사용 사례 중 일부는 많은 양의 정보에서 증상, 질병 또는 치료를 포함하여 다양한 의료 실체를 추출하는 것과 관련이 있습니다.

구조화되지 않은 의학 텍스트에서 패턴과 관계를 그리기 위한 지식 발견은 의료 전문가에게 매우 유용합니다. NLP를 사용하여 정보를 얻을 수 있을 뿐만 아니라 관련 응답을 전달하고 의료 인식 통신 시스템을 위한 자동 완성 기능을 생성하는 데에도 사용할 수 있습니다.

6. 이메일 시스템

2017년 Google 은 기계 학습 기반의 능력인 SmartReply 를 출시하여 적은 노력으로 이메일에 응답했습니다. 빠른 타이핑, 예측 타이핑, 맞춤법 검사 및 문법 검사가 이것의 일부입니다. Smart Reply는 수신 메시지의 텍스트를 스캔하고 사용자가 조정하고 보낼 수 있는 세 가지 기본 응답을 제안하여 단순하거나 평범한 응답에 소요되는 시간을 줄입니다.

이것은 전적으로 메시지를 분석하고 의미를 나타내는 숫자 코드로 변환하도록 훈련된 신경망을 기반으로 합니다. 이메일 시스템 내에서 이메일 분류 및 스팸 감지는 NLP가 우리의 삶을 단순화한 또 다른 방법입니다.

7. 검색 행동

검색 행동 은 우리가 매일 접하는 또 다른 NLP 지원 측면입니다. 검색 엔진은 NLP를 사용하여 유사한 검색 행동이나 사용자 의도를 기반으로 관련 결과를 표시하므로 일반 사용자는 필요한 것을 쉽게 찾을 수 있습니다. 예를 들어, Google은 입력을 시작할 때 개인의 검색어에 어떤 인기 검색어가 적용될지 예측할 뿐만 아니라 관련 접선 결과를 보여주는 전체 그림을 종합적으로 봅니다.

8. 디지털 전화 통화

디지털 전화 통화 는 음성 녹음된 마케팅 메시지가 당신에게 말할 때 하루 중 방해가 되는 부분처럼 보일 수 있지만 이것은 많은 사람들에게 연락하고 문제를 신속하게 해결하는 훌륭한 매체입니다. NLP는 사람의 목소리에 가까운 컴퓨터 생성 언어를 가능하게 하여 소비자로부터 정보를 수집하고 정보 전달 및 약속 예약과 같은 간단한 작업을 수행할 수 있습니다.

9. 스마트 홈

문 잠그기, 창문 내리기 또는 특정 음악 재생과 같은 차량 내 음성 명령은 NLP가 자동차 산업에서 활성화한 기능 중 일부일 뿐입니다 . 자동화 분야에서 홈 오토메이션은 블라인드, 조명 및 가전 제품을 닫거나 여는 음성 명령이 '스마트 홈'의 핵심인 NLP와도 밀접하게 연결되어 있습니다.

이것들은 우리가 삶에서 접하는 많은 NLP 사용법 중 일부에 불과합니다. 접점은 비즈니스, 개인 개발, HR, 영업, 교육, 의학, 통신, 자동차, 인프라, 코칭 등의 세계에 있습니다.

무엇 향후 계획?

NLP는 빅 데이터 및 딥 러닝에 비해 아직 초기 단계이지만 고객 서비스의 미래로 널리 간주됩니다. 데이터를 보다 사용자 친화적이고 대화형으로 만들어 비즈니스 분석의 핵심으로 만들 것을 약속합니다. 예를 들어 챗봇은 복잡하고 긴 형식의 요청을 실시간으로 디코딩할 수 있는 기능을 통해 훨씬 더 정교하고 건전할 것입니다.

현재 NLP 능력과 관련하여 변경될 가능성이 있는 것은 언어에 대한 미묘한 이해입니다. 미래의 NLP는 언어의 미묘함과 어조를 이해할 수 있게 하고 연례 보고서, 통화 녹취록, 투자자에 민감한 커뮤니케이션 또는 법률 및 규정 준수 문서의 영역에 있을 수 있는 유용한 지식과 통찰력을 제공할 것입니다.

NLP의 확장된 사용은 로봇 공학, 의료, 금융 서비스, 자동차 및 인프라 산업에서도 볼 수 있으며 일상적인 사용의 접점이 있습니다. 미래의 NLP는 전 세계적으로 비즈니스를 강화하고 성장시키는 분석의 핵심이 될 것입니다.

자연어 처리에 대해 더 알고 싶으시면 일하는 전문가를 위해 설계된 기계 학습 및 AI 프로그램의 PG 디플로마를 확인하고 30개 이상의 사례 연구 및 과제, 25개 이상의 업계 멘토링 세션, 5개 이상의 실습을 제공합니다. 캡스톤 프로젝트, 450시간 이상의 엄격한 교육 및 일류 기업의 취업 지원.

미래의 직업을 위한 준비

기계 학습 및 인공 지능 PG 디플로마

자세히 알아보기 @ upGrad