마르코프 체인 소개: 전제 조건, 속성 및 응용 프로그램
게시 됨: 2020-04-14전문 기상학자가 날씨를 어떻게 정확하게 예측하는지 또는 Google이 다양한 웹페이지의 순위를 매기는지 생각해 본 적이 있습니까? 그들이 실제 세계에서 매혹적인 파이썬 애플리케이션을 만드는 방법. 이러한 계산은 복잡하고 동적이며 확률 추정을 사용하여 해결할 수 있는 여러 변수를 포함합니다.
Google이 PageRank 알고리즘을 도입했을 때 웹 산업에 혁명을 일으켰습니다. 그리고 해당 알고리즘에 익숙하다면 이 알고리즘이 Markov 체인을 사용한다는 것도 알아야 합니다. Markov chain에 대한 소개에서 우리는 그것들을 간단히 살펴보고 그것들이 무엇인지 이해할 것입니다. 시작하겠습니다.
목차
전제 조건
마르코프 체인에 대해 논의하기 전에 몇 가지 개념을 아는 것이 중요합니다. 그리고 대부분은 확률 이론에서 나온 것입니다. 수학적으로는 무작위 이벤트의 결과로 무작위 변수의 값을 정의할 수 있습니다. 예를 들어, 변수가 주사위를 던진 결과인 경우 숫자가 되는 반면 동전 던지기의 결과인 경우에는 부울(0 또는 1)이 됩니다. 이러한 가능한 결과 세트는 연속적일 수도 있고 이산적일 수도 있습니다.
따라서 확률적 프로세스는 인덱스를 설정하는 임의 변수의 모음이라고 말할 수 있습니다. 해당 세트는 다른 시간 인스턴스를 나타냅니다. 이 집합은 실수(연속 과정) 또는 자연수(이산 과정)일 수 있습니다.
읽기: Python의 내장 데이터 구조
마르코프 체인 소개
마르코프 체인은 1906년에 이 개념을 처음 제기한 Andrey Markov의 이름을 따서 명명되었습니다. 마르코프 체인은 확률 규칙 및 가정에 따라 상태에서 다른 상태로 변이되는 무작위 변수를 포함하는 확률적 프로세스를 나타냅니다.
그 확률적 규칙과 가정은 무엇입니까? 이를 Markov 속성이라고 합니다. 에 대해 자세히 알아보기 Python Tutorial의 마르코프 체인
마르코프 속성이란?
자기회귀 모델 및 가우스 프로세스와 같은 무작위 프로세스 그룹이 많이 있습니다. Markov 속성을 사용하면 이러한 무작위 프로세스를 훨씬 쉽게 연구할 수 있습니다. Markov 속성은 특정 시간의 가치를 알면 과거에 대한 지식을 증가시켜 프로세스의 미래 결과에 대한 더 많은 정보를 얻지 못할 것이라고 말합니다.
좀 더 정교한 정의는 다음과 같습니다. Markov 속성은 확률적 프로세스의 확률이 현재 상태와 시간에만 의존하고 이전에 가졌던 다른 상태와는 독립적이라고 말합니다. 이것이 프로세스의 현재 상태에만 의존하기 때문에 메모리가 없는 속성인 이유입니다.
동종 이산 시간 마르코프 체인은 이산 상태 공간과 시간을 갖는 마르코 프로세스입니다. Markov chain은 일련의 이산적인 상태이며 Markov 속성을 가지고 있다고 말할 수 있습니다.
다음은 Markov 체인의 수학적 표현입니다.
X = ( X n ) n N =( X 0 , X 1 , X 2 , …)
마르코프 사슬의 속성
더 나은 이해를 위해 Markov 체인의 기본 기능을 살펴보겠습니다. 이 기사의 목적은 마르코프 체인의 일반적인 개념에 익숙해지는 것이므로 이 주제에 대해 너무 깊이 파고 들지는 않을 것입니다.
환원성
마르코프 사슬은 환원 불가능합니다. 즉, 다른 상태에서 어떤 상태에도 도달할 수 있는 경우 환원성이 없습니다. 체인은 단일 시간 단계에서 한 상태에서 다른 상태에 도달할 필요가 없습니다. 여러 시간 단계에서 그렇게 할 수 있습니다. 체인을 그래프로 나타낼 수 있다면 그래프는 단단히 연결될 것입니다.

비주기적
상태의 기간이 k라고 가정해 보겠습니다. k = 1이면 상태로의 모든 종류의 복귀가 k 시간 단계의 배수를 요구할 때 이 상태는 비주기적입니다. 마르코프 사슬의 모든 상태가 비주기적이면 마르코프 사슬이 비주기적이라고 말할 수 있습니다.
일시적 및 반복적 상태
상태를 떠나고 그 상태로 돌아갈 수 없을 가능성이 있을 때 우리는 그 상태가 일시적이라고 말합니다. 반면에 확률이 1인 상태로 돌아갈 수 있다면 그 상태를 떠난 후 속성이 반복적이라고 말할 수 있습니다.
우리가 가질 수 있는 재발성 상태에는 두 가지 종류가 있습니다. 첫 번째는 유한한 기대 귀환 시간을 갖는 긍정적인 순환 상태이고, 두 번째는 무한한 기대 귀환 시간을 갖는 널 순환 상태입니다. 예상 복귀 시간은 해당 주를 떠날 때의 평균 재발 시간을 나타냅니다.
마르코프 체인의 응용
Markov 체인은 많은 영역에서 응용 프로그램을 찾습니다. 주요 응용 프로그램은 다음과 같습니다.
- Google의 PageRank 알고리즘은 웹을 Markov 모델처럼 취급합니다. 모든 웹 페이지는 상태이고, 그 사이의 링크는 특정 확률을 갖는 전환이라고 말할 수 있습니다. 다시 말해, Google에서 무엇을 검색하든 특정 웹페이지에 도달할 가능성은 유한합니다.
- Gmail을 사용하는 경우 자동 완성 기능을 보았을 것입니다. 이 기능은 자동으로 문장을 예측하여 이메일을 빠르게 작성할 수 있도록 도와줍니다. Markov 체인은 이러한 종류의 예측을 효과적으로 제공할 수 있으므로 이 부문에서 상당히 도움이 됩니다.
- 레딧이라고 들어보셨나요? 특정 주제의 하위 레딧(Reddit의 커뮤니티 이름)으로 가득 찬 중요한 소셜 미디어 플랫폼입니다. Reddit은 Markov 체인과 모델을 사용하여 하위 레딧을 더 잘 이해하기 위해 시뮬레이션합니다.
자세히 알아보기: 현대 생활에서 언어 모델링의 진화
마지막 생각들
마르코프 체인에 대한 소개가 거의 끝난 것 같습니다. 이 기사가 도움이 되었기를 바랍니다. 질문이나 질문이 있으면 댓글을 통해 자유롭게 공유하세요. 여러분의 의견을 듣고 싶습니다.
이 주제에 대해 더 자세히 알고 싶으시면 코스 섹션으로 이동하십시오. 그곳에서 귀중한 자원을 많이 찾을 수 있습니다.
데이터 과학에 대해 자세히 알아보려면 IIIT-B & upGrad의 데이터 과학 PG 디플로마를 확인하세요. 이 PG 디플로마는 실무 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크숍, 업계 전문가와의 멘토링, 1- 업계 멘토와 일대일, 400시간 이상의 학습 및 최고의 기업과의 취업 지원.
Markov Chains의 실제 응용 프로그램이 있습니까?
별도의 시행 절차를 처리하기 위한 가장 필수적인 테스트 중 하나는 Markov 체인입니다. 금융 및 경제학에서 Markov 체인은 시장 붕괴 및 자산 가치와 같은 다양한 이벤트를 나타내는 데 사용됩니다. 마르코프 체인은 생물학, 경제학, 심지어 실제 시나리오를 포함한 광범위한 학문 분야에 적용됩니다. 주차장에는 정해진 수의 주차 공간이 있지만 여러 요인 또는 변수의 조합을 기반으로 한 Markov 모델을 사용하여 한 순간에 사용할 수 있는 주차 공간의 수를 특성화할 수 있습니다. Markov 체인은 더미 텍스트, 긴 기사 및 연설을 만드는 데 자주 사용됩니다.
마르코프 사슬과 관련하여 평형이라는 용어는 무엇을 의미합니까?
분포 πT는 πT P = πT인 경우 평형 분포라고 합니다. 평형은 Markov 체인을 통해 진행함에 따라 Xt의 분포가 변경되지 않는 상황을 나타냅니다. 사실, Markov 체인의 구별되는 특징은 프로세스가 현재 상태에 도달한 방법에 관계없이 잠재적인 미래 상태가 고정되어 있다는 것입니다. 즉, 주어진 조건으로의 전환 가능성은 현재 상태와 경과 시간에 의해 완전히 결정됩니다.
Markov Chains 시간은 동질적입니까?
임의의 두 시간에서 주어진 두 상태 값 사이의 전이 확률이 해당 시간 간의 차이에만 의존하는 경우 프로세스는 시간 동질적입니다. 마르코프 사슬이 균질하거나 비균질하기 위한 조건이 있습니다. 마르코프 사슬의 전이 확률은 시간과 무관한 경우에만 동질적이라고 합니다. Markov 속성은 비균질 Markov 체인(nhmc)에 유지되지만 전환 확률은 시간에 따라 달라질 수 있습니다. 이 섹션에서는 시뮬레이션된 어닐링에 적용하는 것을 목표로 이러한 체인에 변동 제한의 존재를 보장하는 기준을 제시합니다.