성장하는 성장: 이 오픈 소스 코드로 코호트 분석 수행
게시 됨: 2022-03-11Alejandro Rigatuso는 Facebook과 Twitter에서 게시물을 쉽게 예약할 수 있는 Postcron.com의 설립자입니다. [email protected]으로 그에게 연락할 수 있습니다.
코호트 분석, 유지 및 이탈은 회사 구축의 주요 지표 중 일부입니다.
그러나 이것은 코호트 분석에 대한 또 다른 기사가 아닙니다. 주제의 중요성을 이미 알고 있고 소개를 건너뛰고 싶은 노련한 데이터 과학자라면 코호트 분석을 수행하고 유지, 이탈, 다른 여러 요인을 분석하거나 내가 오픈 소스로 제공한 소프트웨어를 사용하여 자신의 PayPal 로그를 분석할 수 있습니다.
그러나 이것이 가장 중요한 지표라는 것을 깨닫지 못한다면 계속 읽으십시오.
코호트 분석 소개
먼저, 코호트 분석 정의를 통해 여기서 말하는 내용을 이해하겠습니다. 간단히 말해서, 코호트는 공통 정의 특성을 가진 주제 그룹입니다 . 아마도 그들의 나이일 수도 있고, 아마도 그들의 국적일 수도 있고, 아마도 그들의 출생 도시일 수도 있습니다.
나이가 특히 좋은 예입니다. 흔히 우리는 60~80년대에 태어난 사람들을 'X세대'라고 부르고 80~90년대에 태어난 사람들을 'Y세대'라고 부른다. 각 코호트, 각 세대에는 고유한 정의 특성이 있습니다.
유사하게, 모든 회사는 코호트별로 고객을 그룹화하고 분석할 수 있습니다. 고객을 분석하는 일반적이고 매우 유용한 방법은 고객이 서비스를 사용하기 시작한 날짜별로 그룹화하는 것 입니다.
트위터
“ 지난 달 귀하의 수익 중 1년 전에 귀하와 함께 일하기 시작한 고객으로부터 발생한 수익은 얼마입니까? 전혀요? 신규 사용자는 좋아 보일 수 있지만 가입만으로 수익을 얻을 수는 없습니다. 넌 답을 알고 있니? 그렇지 않다면 동질 집단 분석에 대해 배우는 것이 도움이 될 것입니다.
동질 집단, 유지 및 이탈 분석
동질 집단별로 수익을 분석 하면 신규 사용자로부터 발생하는 수익과 기존 사용자로부터 발생하는 수익을 (월 단위로) 추론할 수 있습니다 . 또한 다음 단계를 수행하고 훨씬 더 높은 정확도로 이탈에 대한 유지 및 설명으로 인한 미래 수익을 예측할 수 있습니다.
좋아, 그래서 우리는 집단이 공통된 특징을 가진 사람들의 그룹이라는 것을 확인했습니다. 여기에서 우리는 새로운 힙한 클라우드 컴퓨팅 스타트업의 메트릭을 조사하면서 예제를 진행할 것입니다. 단일 코호트만 분석하는 것으로 시작하겠습니다. 이 경우 2012년 1월에 우리와 함께 일하기 시작한 고객을 살펴보겠습니다.
우리가 계산해야 하는 첫 번째 중요한 측정항목은 유지입니다 . 1월의 신규 사용자 중 2월에도 여전히 우리와 함께 있었던 사람은 몇 명입니까? 1월에 100명의 구독자가 있었는데 20명만이 구독을 취소하기로 결정하여 2월에 80명의 구독자가 남게 되었다고 가정해 보겠습니다. 기본 유지 분석에 따르면 유지율이 80%라고 합니다. 이제 8명의 고객이 2월에 취소하기로 결정했다고 가정해 보겠습니다. 따라서 3월에는 80-8=72명의 사용자가 있습니다. 72/80 = 90%이므로 2012년 1월 코호트의 경우 2개월 후에 90%의 유지율을 보였습니다.
어떤 사람들은 리텐션을 코호트의 초기 크기의 함수로 계산하지만 저는 리텐션을 각 코호트의 이전 달의 함수로 계산하는 것을 선호합니다.
이탈률은 또 다른 필수 지표입니다. 리텐션의 관점에서 정의할 수 있습니다. churn = 1 - 리텐션. 따라서 80% 리텐션은 20% 이탈을 의미합니다. 즉, 고객이 서비스를 떠나는 비율입니다.
클라우드 컴퓨팅 스타트업으로 돌아가 이상적인(읽기: 비현실적인) 사례 를 분석해 보겠습니다. 유지율 100%입니다. 즉, 고객 중 누구도 서비스를 떠나지 않으며 아무도 취소하지 않습니다. 우리 회사가 한 달에 1,000명의 신규 고객을 얻는다고 가정해 보겠습니다. 24개월 후 이 회사의 활성 고객은 24,000명입니다. 나쁘지 않아. 불행히도 이 시나리오는 기본적으로 불가능합니다. 100% 유지는 스타트업 천국에서만 존재합니다.
이제 좀 더 현실적이며 우리 회사의 유지율이 90%라고 가정해 보겠습니다. 즉 , 각 집단은 매월 10%의 고객을 잃습니다. 다시, 우리는 매달 1,000명의 신규 고객을 가정할 것입니다.
이 경우 2012년 1월에 1,000명의 신규 사용자를 받은 후 2월에 100명의 고객, 3월에 90명, 4월에 81명의 고객을 잃었습니다. 이 그래프가 어떻게 생겼는지 봅시다.
이전 코호트 그래프를 보면 총 활성 사용자 수가 약 9,000명에서 포화점에 도달했음을 알 수 있습니다. 이 회사는 한 달에 1,000명의 사용자를 수용하더라도 더 이상 9,000명의 사용자를 초과하여 성장하지 않을 것이라는 것을 수학적으로 증명할 수 있습니다.
매월 1000명의 신규 사용자가 90%의 고객 유지율을 기록하고 있으며 24개월 후 약 9,000명의 월간 활성 사용자가 있습니다. 이를 100% 유지율과 비교하면 이상적인 경우(고객 24,000명)의 37.5%에 불과합니다.

간단히 말해서 유지율이 10% 감소하면 24개월 후 총 활성 사용자 수가 62% 감소했습니다 .
핵심 정보: 낮은 유지율은 성장을 제한 하고 동질 집단 분석에 소프트웨어를 사용하면 유지율을 이해하는 데 유용합니다 .
성장하는 성장
이제 다음과 같이 생각할 수도 있습니다. “하지만 Alejandro, 잠깐! 모든 회사에 이탈률이 있고 이탈률이 성장을 제한한다면 일부 회사는 어떻게 하키 스틱 성장을 달성합니까?”
나는 이렇게 대답할 것입니다. "그들의 성장이 성장하고 있기 때문입니다."
성장을 늘리는 방법에는 여러 가지가 있습니다. 마케팅 예산을 늘리고, 전환을 최적화하고, 추천 프로그램을 만드는 것은 모두 입소문을 불러일으키는 성장에 기여할 수 있습니다. 신규 고객 수가 회사의 총 활성 고객 수에 영향을 받는 바이러스 성장의 경우를 분석해 보겠습니다. 다시 말해서 , 시스템에 더 많은 고객이 있다는 것은 새로운 고객을 추천하는 사람이 더 많다는 것과 같습니다 .
회사가 상수(K) 계수 0.20으로 급성장하고 있고 신규 고객 수를 계산하기 위해 적용한 공식이 다음과 같다고 가정해 보겠습니다.
신규 고객(월) = k * 총 고객 수(월-1)
이제 이전과 동일한 예(월 1000명의 신규 사용자 @ 90% 유지)를 시각화해 보겠습니다. 하지만 이번에는 바이러스 성장(K = 0.20)을 보겠습니다.
이 코호트 분석 그래프에는 두 가지 핵심 사항이 있습니다. 첫째, 상수 계수 0.20으로 인해 24개월 후에 총 활성 고객 수(~90,000)가 1000% 증가했습니다. 둘째, 시스템은 24개월 후에도 여전히 성장 중입니다. 포화점에 도달하지 않았습니다 .
따라서 90% 유지율을 보상하기 위해 매월 성장을 증가시키는 메커니즘을 만들어야 합니다 .
이제 이 시점에서 다음과 같이 말할 수 있습니다. “와, 알레한드로: 바이러스 성장이 유지보다 분명히 더 중요합니다. 이것이 우리 고객 기반에 어떤 영향을 미치는지 보십시오!”
나는 "그렇게 빠르지 않습니다."라고 대답할 것입니다.
한 가지 경우를 더 분석해 보겠습니다. 우리의 좋은 클라우드 컴퓨팅 스타트업이지만 유지율이 50%입니다. 우리는 매달 1,000명의 신규 사용자와 바이러스 성장률 K = 0.20을 유지할 것입니다. 그러나 입소문과 상관없이 우리 회사는 매우 나쁜 성과를 내고 있으며 매달 모든 집단에서 고객의 50%를 잃습니다.
24개월 후 우리 회사의 활성 고객은 90,000명이 아닌 3,000명에 불과합니다. 이는 30배의 차이입니다! 유지가 정말 중요합니다.
그런데 왜 리텐션이 그렇게 강력한 영향을 미치는 것일까요? 간단히 말해서: 바이러스 성장은 활성 고객의 수에 달려 있으므로 사용자를 더 오래 유지하면 더 많은 추천을 받게 됩니다.
요약하자면:
- 일반적으로 이탈은 성장을 제한합니다.
- 보유는 바이러스 성장을 증가시킵니다.
- 회사를 수백만 또는 수십억 명의 사용자로 확장하기 위해서는 양호한 유지 및 입소문을 통한 성장이 전제 조건입니다.
이탈률 분석에 대한 마지막 말
더 많은 고객이 사용 후 첫 달에 서비스를 취소하는 것을 보는 것이 일반적입니다. 그렇기 때문에 다음 시뮬레이션에서 두 가지 유지율, 즉 첫 달 유지율과 장기 유지율을 제공합니다. 계산에 이러한 매개변수를 사용하면 더 정확한 결과를 얻을 수 있습니다.
결론
이 코호트 분석 튜토리얼의 목적은 메트릭 및 코호트 분석에 대한 자세한 수업을 제공하는 것이 아닙니다. 실제로 다른 사람들은 이러한 통계의 복잡성에 대해 훨씬 더 깊이 논의했습니다. 대신, 이러한 유형의 분석의 중요성을 일깨워주고, 더 중요한 것은 독자들에게 내 오픈 소스 코호트 분석 소프트웨어 솔루션을 사용하여 자신의 수익 코호트 분석 예와 이탈률을 보여주고 싶습니다.
당신을 깨우는 단 하나의 질문이 있다면 다음과 같습니다.
귀하의 실제 수익 중 1년 전에 귀하와 협력하기 시작한 사용자로부터 발생하는 수익은 얼마입니까?
자신의 코호트 분석을 수행하는 방법
이제 당신 차례입니다! 자신의 비즈니스 유지 및 이탈을 분석하는 두 가지 방법이 있습니다.
- 내가 배포한 도구에 PayPal 데이터를 업로드하세요 . 전체 공개를 위해 이 도구를 사용하면 로그 파일이 처리를 위해 일시적으로 서버에 저장됩니다(데이터가 표시되는 즉시 삭제됨). 그러나 원하는 경우 언제든지...
- 오픈 소스 코드를 다운로드하고 도구를 직접 배포하십시오 . README에는 그렇게 하는 방법에 대한 자세한 지침이 포함되어 있습니다. PayPal 계정이 없는 경우 코드를 쉽게 해킹하여 다른 유형의 계정을 분석할 수 있습니다.
또는 시뮬레이터를 사용하여 위에서 설명한 모든 매개변수를 기반으로 시작 성장을 시각화할 수 있습니다.
읽어 주셔서 감사합니다!