업리프트 모델링
Uplift modelling증분 모델링, 진정한 리프트 모델링 또는 순 모델링이라고도 하는 업리프트 모델링은 개인의 행동에 대한 치료의 증분적 영향(직접 마케팅 조치 등)을 직접 모델링하는 예측 모델링 기법이다.
업리프트 모델링은 상향 판매, 교차 판매 및 보유 모델링을 위한 고객 관계 관리에 응용된다.그것은 또한 정치 선거와 개인 맞춤 의학에도 적용되었다.심리학에서 관련된 차분 예측 개념과 달리 업리프트 모델링은 활성 에이전트를 가정한다.
소개
업리프트 모델링은 무작위화된 과학적 제어를 사용하여 조치의 효과를 측정할 뿐만 아니라 조치에 대한 증분 반응을 예측하는 예측 모델을 구축한다.응답은 이진 변수(예: 웹사이트 방문)[1] 또는 연속 변수(예: 고객 수익)가 될 수 있다.[2]업리프트 모델링은 상향판매, 교차판매, 이탈, 보유활동 등에 금융서비스, 통신, 소매직접마케팅 업종에서 주로 적용되어 온 데이터 마이닝 기법이다.
상승률 측정
마케팅 캠페인의 상향 조정은 일반적으로 처리된 그룹과 무작위화된 통제 그룹 간의 응답률 차이로 정의된다.이것은 마케팅 팀이 마케팅 활동의 효과를 분리하고 그 개별적인 마케팅 활동의 효과나 그 밖의 다른 방법을 측정할 수 있게 해준다.정직한 마케팅 팀들은 그들의 캠페인의 점진적인 효과에 대해서만 인정받을 것이다.
그러나 많은 마케터들은 리프트(업리프트가 아닌 리프트)를 치료와 통제 사이의 응답률 차이로 정의하기 때문에 업리프트 모델링은 예측 모델링을 통한 개선(업리프트) 리프트로 정의할 수 있다.
아래 표는 가상의 마케팅 캠페인에 대한 응답 수와 계산된 응답률을 보여주는 캠페인의 세부사항을 보여준다.이 캠페인은 응답률 5% 상승으로 정의될 것이다.50,000개의 점증적 응답(10만 - 5만 개)을 생성했다.
그룹 | 고객 수 | 응답 | 응답 속도 |
---|---|---|---|
다뤘다 | 1,000,000 | 100,000 | 10% |
컨트롤 | 1,000,000 | 50,000 | 5% |
기존 응답 모델링
전통적인 대응 모델링은 일반적으로 처리된 고객 그룹을 취하며 다수의 예측 모델링 기법 중 하나를 사용하여 가능한 대응자와 비응답자를 구분하는 예측 모델을 구축하려고 시도한다.일반적으로 이것은 의사결정 나무나 회귀 분석을 사용한다.
이 모델은 모델을 만드는 데 오직 치료받은 고객만을 사용할 것이다.
대조적으로 상향식 모델링은 점진적 반응에 초점을 맞춘 예측 모델을 구축하기 위해 처리된 고객과 통제 고객 모두를 사용한다.이러한 유형의 모델을 이해하기 위해 고객을 다음과 같은 그룹으로 구분하는 근본적인 세분화가 제안된다(N. Radcliffe에서 제안하고 )
- 설득력 있는 고객: 타깃이 되었기 때문에 마케팅 활동에만 반응하는 고객
- 확실한 것 : 대상인지 아닌지에 상관없이 응대했을 고객들
- 분실 원인 : 대상 유무에 관계없이 응답하지 않는 고객
- 방해하지 않는 개와 잠자는 개 : 대상이라 응답 가능성이 낮은 고객
진정한 증분 반응을 제공하는 유일한 부문은 설득력 있는 사람들이다.
업리프트 모델링은 위에서 설명한 그룹으로 고객을 분리할 수 있는 점수 매기기법을 제공한다.
전통적인 대응 모델링은 종종 설득력 있는 것과 구별할 수 없는 확실성을 목표로 한다.
투자 수익률
업리프트 모델링은 점진적인 대응에만 초점을 맞추기 때문에 전통적인 수요 창출 및 보유 활동에 적용할 때 투자 사례에 대한 매우 강력한 수익을 제공한다.예를 들어, 아웃바운드 마케팅 캠페인에서 설득력 있는 고객만을 대상으로 하여, 접촉 비용 및 따라서 단위 지출당 수익률을 획기적으로 개선할 수 있다.
부정적 효과 제거
업리프트 모델링의 가장 효과적인 사용 중 하나는 보존 캠페인의 부정적인 효과를 제거하는 것이다.통신업계와 금융서비스업계 둘 다 종종 보유 캠페인이 고객들로 하여금 계약이나 정책을 취소하게 할 수 있다.업리프트 모델링을 통해 이러한 고객인 '방해하지 마십시오'를 캠페인에서 제거할 수 있다.
A/B 및 다변량 테스트 적용
치료와 통제 그룹이 하나 있는 경우는 드물다.종종 "치료"는 하나의 치료로 분류되는 메시지의 다양한 단순한 변형이나 다단계 접촉 전략이 될 수 있다.A/B 또는 다변량 시험의 경우 상향 모델링은 시험의 변동이 행동 또는 인구통계학적 지표와 같은 다른 목표 기준과 비교하여 유의미한 상향 조정을 제공하는지 여부를 이해하는 데 도움이 될 수 있다.
업리프트 모델링의 역사
진정한 대응 모델링의 첫 등장은 래드클리프와 서리의 작품에 있는 것으로 보인다.[4]
빅터 로도 이 주제에 대해 The True Lift Model(2002년)[5]에서 발표했으며, 이후 Radcliffe는 Use Control Groups to Target on Target on Levelt: Building and Evaluation Uplight Model(2007년)에서 다시 발표하였다.[6]
래드클리프는 또한 그의 웹사이트인 사이언티픽 마케터(Scientific Marketer)에서 매우 유용한 자주 묻는 질문(FAQ) 코너를 제공한다.[7]Lo(2008)는 미래 연구 영역과 함께 프로그램 설계부터 예측 모델링, 최적화까지 보다 일반적인 프레임워크를 제공한다.[8]
독립적으로 상향식 모델링은 피오트르 레자코프스키에 의해 연구되었다.그는 시지몬 야로스체위츠와 함께 정보이론을 채택하여 다중 계급 상승 의사결정 트리를 구축하였고 2010년에 논문을 발표하였다.[9]그리고 2011년 후반에 그들은 알고리즘을 여러 치료 사례로 확장했다.[10]
개인화된 의학에서도 유사한 접근법이 탐구되어 왔다.[11][12]시지몬 야로스체위츠와 피오트르 레자코프스키(2014)는 생존 분석을 위한 상승 방법론을 설계해 무작위 제어 시험 분석에 적용했다.[13]용(2015년)은 동적 프로그래밍을 통한 수학적 최적화 알고리즘과 머신러닝 방법을 결합해 환자를 최적으로 계층화했다.[14]
업리프트 모델링은 차등 예측의 오래된 심리학 개념의 특별한 경우다.[15]차등 예측과 대조적으로 상승 모델링은 활성 에이전트를 가정하며 상승 측정치를 최적화 지표로 사용한다.
업리프트 모델링은 최근 유도 로직 프로그래밍,[15] 베이시안 네트워크,[16] 통계 관계 학습,[12] 지원 벡터 머신,[17][18] 서바이벌 분석[13] 및 앙상블 학습과 같은 다양한 기계 학습 알고리즘으로 확장 및 통합되고 있다.[19]
업리프트 모델링은 (정치선거와 함께) 마케팅 실무에 폭넓게 적용되고 있지만, 마케팅 문학에는 거의 등장하지 않았다.케인, 로, 젱(2014년)은 마케팅 저널에 복수의 방법을 이용한 3가지 데이터 세트에 대한 철저한 분석을 발표했고, 새로운 접근법(일명 4사분원법)이 실제로 상당히 잘 작동했다는 증거를 제공했다.[20]Lo와 Pachamanova(2015)는 복수의 치료 상황에 대한 규범적 분석을 위한 상향식 모델링을 확장했고, 추정치가 정확하지 않은 대규모 결정론적 최적화 문제와 복잡한 확률적 최적화 문제를 해결하기 위한 알고리즘을 제안했다.[21]
최근의 연구는 대량의 데이터를 이용한 벤치마크 연구에서 다양한 최첨단 상승 모델의 성능을 분석한다.[22][1]
업리프트 모델, 업리프트 모델 이력, 업리프트 모델 구축 방식, 클래식 모델 구축과의 차이점 및 업리프트별 평가 기법, 다양한 소프트웨어 솔루션 비교 및 다양한 경제 시나리오에 대한 설명을 여기에서 확인할 수 있다.[23]
구현
인 파이톤
인 R
다른 언어
데이터 집합
- Hillstrom Email Marketing 데이터 집합
- Criteo 업리프트 예측 데이터 세트
- 렌타 업리프트 모델링 데이터 세트
- X5 RetailHero 업리프트 모델링 데이터 세트
- MegaFon 업리프트 경쟁 데이터 세트
참고 및 참조
- ^ a b Devriendt, Floris; Moldovan, Darie; Verbeke, Wouter (2018). "A literature survey and experimental evaluation of the state-of-the-art in uplift modeling: A stepping stone toward the development of prescriptive analytics". Big Data. 6 (1): 13–41. doi:10.1089/big.2017.0104.
- ^ Gubela, Robin M.; Lessmann, Stefan; Jaroszewicz, Szymon (2020). "Response transformation and profit decomposition for revenue uplift modeling". European Journal of Operational Research. 283 (2): 647–661. arXiv:1911.08729. doi:10.1016/j.ejor.2019.11.030.
- ^ N. 래드클리프(2007년).보존 활동에 의해 누가 저장될 수 있고 누가 쫓겨날지 식별.확률적 솔루션 유한회사
- ^ Radcliffe, N. J. 및 Surry, P. D.(1999); 미분 반응 분석: Edinburgh University of Medit Scoring and Credit Control VI, Credit Research Center, University of Edinburgh Management School에서 단일 조치의 효과를 분리하여 진정한 대응 모델링
- ^ Lo, V. S. Y.(2002);진정한 리프트 모델, ACM SIGKDD 탐험 뉴스레터, 제4권, 제2, 78–86호, http://www.sigkdd.org/sites/default/files/issues/4-2-2002-12/lo.pdf Archived 2015-01-20 Wayback Machine에서 이용 가능
- ^ Radcliffe, N. J(2007);제어 그룹을 사용하여 예상 리프트를 공략: 상향 이동 모델 구축 및 평가, 직접 마케팅 분석 저널, 직접 마케팅 협회
- ^ 업리프트 모델링에 관한 과학 마케터 FAQ
- ^ Lo, V. S.Y.(2008) "마케팅 데이터 마이닝의 새로운 기회"데이터 웨어하우징 및 마이닝 백과사전 2판, Wang(2008)이 편집한 아이디어 그룹 출판사.
- ^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2010). Decision trees for uplift modeling. In Proceedings of the 10th IEEE International Conference on Data Mining (ICDM'10). Sydney, Australia. pp. 441–450. doi:10.1109/ICDM.2010.62. ISBN 978-1-4244-9131-5.
- ^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2011). "Decision trees for uplift modeling with single and multiple treatments". Knowledge and Information Systems. 32 (2): 303–327. doi:10.1007/s10115-011-0434-0.
- ^ Cai, T.; Tian, L.; Wong, P. H., Wei, L. J.(2009);맞춤형 치료 선택을 위한 무작위 비교 임상시험 데이터 분석, 하버드대 생물통계 워킹페이퍼 시리즈, 페이퍼 97
- ^ a b Nassif, Houssam; Kuusisto, Finn; Burnside, Elizabeth S; Page, David; Shavlik, Jude; Santos Costa, Vitor (2013). Score As You Lift (SAYL): A Statistical Relational Learning Approach to Uplift Modeling. European Conference on Machine Learning (ECML'13). Lecture Notes in Computer Science. Vol. 8190. Prague. pp. 595–611. doi:10.1007/978-3-642-40994-3_38. ISBN 978-3-642-38708-1. PMC 4492311. PMID 26158122.
- ^ a b Jaroszewicz, Szymon; Rzepakowski, Piotr (2014). "Uplift modeling with survival data" (PDF). ACM SIGKDD Workshop on Health Informatics (HI KDD'14). New York, USA.
- ^ 용, F.H. (2015), "성층화된 의학의 양적 방법," 하버드 T.H. Chan School of Public Health, http://dash.harvard.edu/bitstream/handle/1/17463130/YONG-DISSERTATION-2015.pdf?sequence=1.
- ^ a b Nassif, Houssam; Santos Costa, Vitor; Burnside, Elizabeth S; Page, David (2012). Relational Differential Prediction. European Conference on Machine Learning (ECML'12). Lecture Notes in Computer Science. Vol. 7523. Bristol, UK. pp. 617–632. doi:10.1007/978-3-642-33460-3_45. ISBN 978-3-642-33459-7.
- ^ Nassif, Houssam; Wu, Yirong; Page, David; Burnside, Elizabeth (2012). "Logical Differential Prediction Bayes Net, Improving Breast Cancer Diagnosis for Older Women". American Medical Informatics Association Symposium (AMIA'12). 2012: 1330–1339. PMC 3540455. PMID 23304412.
- ^ Kuusisto, Finn; Santos Costa, Vitor; Nassif, Houssam; Burnside, Elizabeth; Page, David; Shavlik, Jude (2014). Support Vector Machines for Differential Prediction. European Conference on Machine Learning (ECML'14). Lecture Notes in Computer Science. Vol. 8725. Nancy, France. pp. 50–65. doi:10.1007/978-3-662-44851-9_4. ISBN 978-3-662-44850-2. PMC 4492338. PMID 26158123.
- ^ Zaniewicz, Lukasz; Jaroszewicz, Szymon (2013). "Support Vector Machines for Uplift Modeling". The First IEEE ICDM Workshop on Causal Discovery. Dallas, Texas.
- ^ Sołtys, Michał; Jaroszewicz, Szymon; Rzepakowski, Piotr (2015). "Ensemble methods for uplift modeling". Data Mining and Knowledge Discovery. 29 (6): 1531–1559. doi:10.1007/s10618-014-0383-9.
- ^ Kane, K.; Lo, V.S.Y.; Zheng, J. (2014). "Mining for the Truly Responsive Customers and Prospects Using True-Lift Modeling: Comparison of New and Existing Methods". Journal of Marketing Analytics. 2 (4): 218–238. doi:10.1057/jma.2014.18.
- ^ Lo, V.S.Y.; Pachamanova, D. (2015). "From Predictive Uplift Modeling to Prescriptive Uplift Analytics: A Practical Approach to Treatment Optimization While Accounting for Estimation Risk". Journal of Marketing Analytics. 3 (2): 79–95. doi:10.1057/jma.2015.5.
- ^ Gubela, Robin M.; Bequé, Artem; Lessmann, Stefan; Gebert, Fabian (2019). "Conversion Uplift in E-Commerce: A Systematic Benchmark of Modeling Strategies". International Journal of Information Technology & Decision Making. 18 (3): 747-791. doi:10.1142/S0219622019500172.
- ^ R. Michel, I. Schnakenburg, T. von Martens (2019)"Targeting Uplift".스프링거, ISBN 978-3-030-22625-1