λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
1️⃣ AI•DS/πŸ₯Ž Casual inference

The science of price experiments in the Amazon Store

by isdawell 2023. 4. 21.
728x90

 

원문 

 

 

 

β—― μ•„λ§ˆμ‘΄ μŠ€ν† μ–΄μ—μ„œμ˜ 가격 μ‹€ν—˜ 

 

•  μ•„λ§ˆμ‘΄ μŠ€ν† μ–΄μ˜ μƒν’ˆμ˜ 가격은 μˆ˜μš”,κ³„μ ˆμ„±,일반적인 경제적 νŠΈλ Œλ“œμ™€ 같은 μš”μ†Œλ₯Ό λ°˜μ˜ν•˜κ³  μžˆλ‹€. 

•  가격 정책도 κ·ΈλŸ¬ν•œ 뢀뢄을 μ€‘μš”ν•˜κ²Œ 두고 μžˆλ‹€. μƒˆλ‘œμš΄ 가격 정책은 λ¨Έμ‹ λŸ¬λ‹ 방법둠을 많이 ν™œμš©ν•˜κ³  μžˆλ‹€. Amazon pricing labs μ—μ„œλŠ” μƒˆλ‘œμš΄ 가격 정책을 ν‰κ°€ν•˜κΈ° μœ„ν•΄ 온라인 A/B test λ₯Ό μˆ˜ν–‰ν•˜κ³  μžˆλ‹€. 

•  μ•„λ§ˆμ‘΄ μŠ€ν† μ–΄λ₯Ό λ°©λ¬Έν•˜λŠ” λͺ¨λ“  μ†ŒλΉ„μžλ“€μ΄ λ™μ‹œμ— λͺ¨λ“  μ œν’ˆμ— λŒ€ν•΄ λ™μΌν•œ 가격에 ꡬ맀할 수 μžˆλ„λ‘ ν•˜λŠ” μ°¨λ³„μ—†λŠ” 가격 책정을 μ‹€μ²œν•˜κ³  μžˆμœΌλ―€λ‘œ, 각기 λ‹€λ₯Έ κ³ κ°μ—κ²Œ λ‹€λ₯Έ 가격을 μ œμ‹œν•˜λŠ” 것이 μ•„λ‹ˆλΌ μ‹œκ°„μ΄ 지남에 따라 μ œν’ˆ 가격에 λŒ€ν•œ μ‹€ν—˜μ μΈ 처치λ₯Ό μ μš©ν•΄μ•Ό ν•œλ‹€. 

 

 

β—― Time-bound experiment 

 

•  μƒˆλ‘œμš΄ 가격 책정을 평가해야 ν•  λ•Œ, νŒŒκΈ‰νš¨κ³Όλ₯Ό λ°©μ§€ν•˜κ³ , 정확도λ₯Ό κ°œμ„ ν•˜κ³ , μˆ˜μš” νŠΈλ Œλ“œμ™€ μ²˜μΉ˜μ§‘λ‹¨μ—μ„œμ˜ 차이λ₯Ό ν†΅μ œν•˜κΈ° μœ„ν•΄ μ‹€ν—˜μ„ μ§„ν–‰ν•œλ‹€. 

•  κ°€μž₯ κ°„λ‹¨ν•˜κ²Œ μˆ˜ν–‰ν•  수 μžˆλŠ” μœ ν˜•μ˜ μ‹€ν—˜μ€ νŠΉμ • class의 일뢀 μ œν’ˆμ— treatment λ₯Ό μ μš©ν•˜κ³ , class 의 λ‹€λ₯Έ μ œν’ˆμ€ untreated ν•œ μƒνƒœλ‘œ λ‘λŠ”, 즉 controls 둜 μ„€μ •ν•œμ±„λ‘œ μ§„ν–‰ν•˜λŠ” μ‹œκ°„ μ œν•œ μ‹€ν—˜μ΄λ‹€. 

 

 

•  time bound μ‹€ν—˜μ—μ„œ λ°œμƒν•  수 μžˆλŠ” λ…Έμ΄μ¦ˆμ˜ 잠재적 μš”μ†ŒλŠ” λ‹€λ₯Έ μƒμ μ—μ„œ 같은 μƒν’ˆμ— μ μš©ν•˜λŠ” μΌμ‹œμ μΈ 할인과 같이 treatment 에 영ν–₯을 λ―ΈμΉ  수 μžˆλŠ” 외뢀적인 μ΄λ²€νŠΈμ΄λ‹€. λ§Œμ•½ μ΄λŸ¬ν•œ μš”μΈλ“€μ„ 사전에 μ •μ˜ν•  수 μžˆλ‹€λ©΄  triggered intervention 을 μˆ˜ν–‰ν•  수 μžˆλ‹€. 즉, treatment 와 control 의 μ‹œμž‘ μ‹œκ°„μ„ 이벀트 λ°œμƒ κΈ°κ°„μœΌλ‘œ 지정할 수 μžˆλ‹€. 

 

 

β€» "Triggered intervention"은 일반적으둜 κ°œμΈμ΄λ‚˜ 그룹의 νŠΉμ • 행동, λ°˜μ‘, μƒνƒœ 등을 κ°μ§€ν•˜κ³ , 이λ₯Ό 기반으둜 μžλ™μœΌλ‘œ μ–΄λ–€ 쑰치λ₯Ό μ·¨ν•˜λŠ” μ‹œμŠ€ν…œ λ˜λŠ” 방법을 λ§ν•œλ‹€. λ§ˆμΌ€νŒ… λΆ„μ•Όμ—μ„œλŠ” 고객의 행동 νŒ¨ν„΄μ„ λΆ„μ„ν•˜μ—¬ νŠΉμ • μ΄λ²€νŠΈκ°€ λ°œμƒν•˜λ©΄ μžλ™μœΌλ‘œ νŠΉμ • κ΄‘κ³ λ₯Ό λ³΄μ—¬μ£ΌλŠ” λ“±μ˜ μžλ™ν™”λœ λ§ˆμΌ€νŒ… 방법이 될 수 μžˆλ‹€. 

 

 

β—― Triggered experiment 

 

 

β†ͺ 외뢀적인 event 둜 μΈν•΄μ„œ μœ λ°œλ˜λŠ” 각 μ‹€ν—˜μ˜ μ‹œμž‘ ν¬μΈνŠΈκ°€ λ‹€λ₯Ό 수 μžˆλ‹€. 

 

 

 

β—― Switchback experiment 

 

 

•  λ§Œμ•½ μƒν’ˆμ— λŒ€ν•œ μˆ˜μš”κ³‘μ„ μ΄ μΆ©λΆ„νžˆ λΉ„μŠ·ν•˜κ³ , μ²˜μΉ˜μ§‘λ‹¨κ³Ό ν†΅μ œμ§‘λ‹¨ μ‚¬μ΄μ˜ κ²°κ³Ό 차이가 μΆ©λΆ„νžˆ 차이가 λ‚œλ‹€λ©΄, time-bound 와 triggered μ‹€ν—˜μ€ μΆ©λΆ„ν•  수 μžˆλ‹€. κ·ΈλŸ¬λ‚˜ 가격 μ±…μ •μ˜ μ •ν™•ν•œ 평가λ₯Ό μœ„ν•΄, 같은 μƒν’ˆμ— λŒ€ν•΄ treatment 와 control μ‹€ν—˜μ€ ν•„μš”ν•  수 μžˆλ‹€. (μ „ν˜•μ μΈ A/B test) μ΄λŸ¬ν•œ 것은 switchback μ‹€ν—˜μ΄ ν•„μš”ν•˜λ‹€. 

•  switchback experiment λŠ” random-days experiment 둜, μ²˜μΉ˜μ§‘λ‹¨κ³Ό ν†΅μ œμ§‘λ‹¨ λͺ¨λ‘μ— 각 μš”μΌμ— 각 μƒν’ˆμ΄ λžœλ€ν•˜κ²Œ λ°°μ •λ˜λŠ” 방식이닀. λžœλ€ν•˜κ²Œ μš”μΌμ„ μ„ νƒν•¨μœΌλ‘œμ¨ μ‹€ν—˜μ μΈ 결과의 ν‘œμ€€μ˜€μ°¨λ₯Ό 쀄일 수 μžˆλ‹€. 

 

 

β—― Cross over experiment 

 

 

•  ꡐ차 μ‹€ν—˜μ—μ„œ 그룹의 일뢀 μ œν’ˆμ— λŒ€ν•΄ λ‹€λ₯Έ μ œν’ˆμ€ treatment λŒ€μƒμœΌλ‘œ 두고 두 그룹의 첫주 λ°μ΄ν„°λŠ” λͺ¨λ‘ μ‚­μ œν•  수 μžˆλ‹€. μΆ©λΆ„ν•œ 데이터 (2주치) 데이터λ₯Ό μˆ˜μ§‘ν•œ ν›„ 이전 treatment κ·Έλ£Ήμ—μ„œ treatment λ₯Ό μ œκ±°ν•˜κ³  이전 control 그룹에 μ μš©ν•œλ‹€. μ΄λŠ” carryover 효과λ₯Ό μ€„μ–΄λ“€κ²Œ ν•  수 μžˆλ‹€. 

•  ꡐ차 μ‹€ν—˜μ€ 결과의 ν‘œμ€€μ˜€μ°¨λ₯Ό 40% μ—μ„œ 50%κΉŒμ§€ μ€„μ˜€λ‹€. 

 

 

 

 

β—― Heterogeneous panel treatment effect 

 

•  HPTE 의 4단계 κ³Όμ • 

  β‘  detrended data λ‘œλΆ€ν„° μƒν’ˆλ ˆλ²¨μ˜ first difference λ₯Ό μΆ”μ •ν•œλ‹€. 

  β‘‘ Outlier λ₯Ό κ±°λ₯Έλ‹€. 

  β‘’ causal forest λ₯Ό μ‚¬μš©ν•˜μ—¬ κ·Έλ£Ήν™”λœ μƒν’ˆμœΌλ‘œλΆ€ν„° second difference λ₯Ό μΆ”μ •ν•œλ‹€. 

  β‘£ λ…Έμ΄μ¦ˆλ₯Ό estimate ν•˜κΈ° μœ„ν•΄ data λ₯Ό bootstrap ν•œλ‹€. 

 

 

β‘  First difference 

 

•  DID 뢄석을 μœ„ν•΄ μ§„ν–‰ν•˜λŠ” first difference λŠ” μ‹€ν—˜μ΄ μ‹œμž‘λ˜κΈ° μ „κ³Ό 후에 단일 μ œν’ˆμ— λŒ€ν•œ 결과의 차이닀. 

•  λ‹¨μˆœνžˆ 치료 ν›„ κ²°κ³Όμ—μ„œ 치료 μ „ κ²°κ³Όλ₯Ό λΉΌλŠ” 것이 μ•„λ‹ˆλΌ, 과거의 μΆ”μ„Έλ₯Ό 뢄석해 treatment κΈ°κ°„λ™μ•ˆ μ œν’ˆμ„ treat ν•˜μ§€ μ•Šμ•˜λ‹€λ©΄ 어떀일이 λ²Œμ–΄μ‘Œμ„μ§€ μ˜ˆμΈ‘ν•œλ‹€. 그런 λ‹€μŒ κ΄€μ°°λœ κ²°κ³Όμ—μ„œ 예츑된 값을 λΊ€λ‹€. 

 

 

β‘‘ Filter outliers 

 

•  가격 μ‹€ν—˜μ—μ„œ, κ²°κ³Ό μΈ‘μ •μ—μ„œ κ·Ήμ‹¬ν•œ λ³€ν™”λ‘œ 인해 κ΄€μ°°λ˜μ§€ μ•Šμ€ μš”μΈλ“€μ΄ μ’…μ’… λ°œμƒν•œλ‹€. cutoff point λ₯Ό μ‚¬μš©ν•΄ μ΄λŸ¬ν•œ outlier 듀을 μ œκ±°ν•œλ‹€. 

 

 

β‘’ causal forest λ₯Ό μ‚¬μš©ν•΄ second difference κ΅¬ν•˜κΈ° 

 

•  DID λΆ„μ„μ—μ„œ, second difference λŠ” treatment group κ³Ό control group 의 first difference μ—μ„œμ˜ 차이λ₯Ό μ˜λ―Έν•œλ‹€. 이질적인 μƒν’ˆμ˜ 집단 차이λ₯Ό κ³„μ‚°ν•˜κ³  평균을 μ·¨ν•œλ‹€. 

•  Affinity score λ₯Ό κ³„μ‚°ν•˜κΈ° μœ„ν•΄ causal forests 라고 λΆˆλ¦¬λŠ” κ²°μ •νŠΈλ¦¬μ˜ 변동성을 μ‚¬μš©ν•œλ‹€. 

 

 

β‘£ Bootstrap data 

 

•  ν‘œμ€€μ˜€μ°¨λ₯Ό κ³„μ‚°ν•˜κΈ° μœ„ν•΄ μƒν’ˆλ“€μ„ λžœλ€ν•˜κ²Œ μƒ˜ν”Œλ§ν•˜κ³  ν‰κ· μ²˜μΉ˜νš¨κ³Όλ₯Ό κ³„μ‚°ν•œλ‹€. 

 

 

 

β—― Spillover effect 

 

•  νŠΉμ •ν•œ ν•œ μƒν’ˆμ˜ treatemnt κ°€ λ‹€λ₯Έ λΉ„μŠ·ν•œ μƒν’ˆμ˜ μˆ˜μš”λ₯Ό λ°œμƒμ‹œν‚€λŠ” νŒŒκΈ‰νš¨κ³Όλ₯Ό κ³„μ‚°ν•˜κΈ° μœ„ν•œ 방법듀도 λ„μž…ν•˜κ³  μžˆλ‹€. 

 

 

 

 

 

 

728x90

λŒ“κΈ€