[Causal ML] κ°μ°μλ£ μ 리
β― Causal representation learning
• 볡μ‘ν νμ΅ λͺ¨λΈμ νΉμ±μ λν΄ μ΄ν΄νκΈ° μν΄ μ΅κ·Ό λ₯λ¬λ λΆμΌμμ μΈκ³ΌμΆλ‘ μ λν κ΄μ¬μ΄ λμμ§κ³ μλ€.
• causality λ₯Ό νμ©νλ€λ©΄ κ΄μ°°λ μν©κ³Ό λ€λ₯Έ νκ²½μμλ robust ν μμΈ‘μ ν μ μμΌλ©° λ°μ΄ν° μ¬μ΄μ μΈκ³Όκ΄κ³λ νμ ν μ μκΈ° λλ¬Έμ causality κ΄μ μ΄ λ°λμ νμνλ€. causality λ₯Ό ν΅ν΄ ML μ νκ³μ μ 극볡ν μ μλ€.
• λ₯λ¬λ μ°½μμ μμμ λ²€μ§μ€λ AI λ₯Ό κ°λ°ν λ μΈμ§λ₯λ ₯μ λνλ€λ©΄ λ¨Έμ λ¬λκ³Ό κ΄λ ¨λ λ¬Έμ λ€μ΄ μ€λͺ κ°λ₯νκ² λ κ²μ΄λΌ μ λ§νλ€. μ¬λμ΄ μμνλ μΈμ§λ₯λ ₯μ μ€νν μ μλ μλ‘μ΄ νμ΅ λͺ¨λΈμ΄ νμνλ€λ©° μΈκ³Όνμ΅μ μ€μμ±μ μΈκΈνλ€.
β― Causal machine learning in practice : Netflix
• λ¨Έμ λ¬λμ 'λ·νλ¦μ€κ° μ½ν μΈ λ¦¬μ€νΈμ D.P λμ μ μ€μ§μ΄κ²μμ μλ¨μ λλλ€λ©΄ μ΄μ©μμ μ½ν μΈ μ΄μ©μ μ¦λμν¬ μ μμκΉ' μ κ°μ "What if" λ¬Έμ μ λ΅νμ§ λͺ»νλ€.
• λ¨Έμ λ¬λμμ μΈκ³ΌμΆλ‘ μ μ₯μ μ μ¬μ©ν μ μμκΉ
βͺ λ°μ΄ν°λ‘λΆν° μΈκ³Όκ΅¬μ‘°λ₯Ό λ°κ²¬νκ³ , μ΄μ§μ μΈ μ²μΉν¨κ³Όλ₯Ό μΆμ νκΈ° μν 볡μ‘ν ν¨μλ₯Ό νμ΅νλ€.
• μΈκ³Όν¨κ³Όλ₯Ό μΆμ νλ λ°©λ²
βͺ RCT (ATE) , Controlling confounders (CATE), IV (LATE)
• CATE estimation with ML
βͺ Meta-learning μ CATE (conditional average treatment effect) estimation μ μνout of the box ML model μ μ΄μ©νλ€.
βͺ Double/Orthogonalized learning μ Propensity score μ outcome model μ κ²°ν©νλ€.
βͺ Tree-based model μ CART/RF μ node split κΈ°μ€μ λ³κ²½νλ€.
βͺ Neural Net-based model μ 곡μ λ representation layer λ₯Ό κ°μ§κ³ control κ³Ό treatment μ λν κ²°κ³Όλ₯Ό λμμ νμ΅νλ€.
• Causal ML tools
βͺ R : grf
βͺ Python
βΈ do-calculus μ κΈ°λ°ν μΈκ³Όκ΅¬μ‘°λ₯Ό λμΆν΄λΌ μ μλ μΈν°νμ΄μ€λ₯Ό μ 곡 : Dowhy
βΈ MLμ κΈ°λ°ν CATE μΆμ λ°©λ²μ μ 곡 : EconML
βΈ MLμ κΈ°λ°ν CATE μΆμ λ°©λ²μ μ 곡 : Causal ML
βΈ PySpark μ H2O λ₯Ό κ°μ§κ³ modeling μ ν¨μΌλ‘μ¨ scalable ν λͺ¨λΈ : upliftML
• Causal ML μ€μ μ°μ μ μ© case
βͺ Observational causal inference : κ³ κ° κ°μΉ λ³ν λ°μ λΆμ νλ‘μ νΈμμ, κ΅μ°¨ νλ§€ μ ν (Cross-selling) μ΄ κΈ°μ‘΄ μ¬μ©μμ μ₯κΈ°μ κ°μΉμ λ―ΈμΉλ μν₯μ μΈ‘μ
β» Cross-selling : κΈ°μ μ μ νκ³Ό μλΉμ€ μ€ νλλ₯Ό ꡬ맀ν κ³ κ°μκ² κ·Έ κΈ°μ μ΄ μ 곡νλ λ€λ₯Έ μ νμ΄λ μλΉμ€λ₯Ό μΆκ°μ μΌλ‘ νλ§€νλ μ λ΅μ λ§νλ€. κ°λ Ή μμ΄μ μΈ λ₯Ό μ° μ¬λμκ² μ΄μΈλ¦¬λ νμ΄λ₯Ό μ μνλ κ²½μ°λ₯Ό λ§νλ€.
βͺ Targeting optimization : RTB Targeting Optimization νλ‘μ νΈμμλ μ 리ννΈ λͺ¨λΈλ§μ μ¬μ©νμ¬ μ€λλ ₯ μλ μ¬μ©μ κ·Έλ£Ή (κ΄κ³ λ ΈμΆμλ§ λ°μνλ μ¬μ©μ) μ μ ννμ¬ κ΄κ³ λΉμ© μμ΅λ₯ μ μ΅μ ννλ€.
βͺ Personalization : μ°λ¦¬λ heterogeneous treatment effect λ₯Ό νμ΅ν¨μΌλ‘μ¨ μ¬μ©μμ λ ν¨κ³Όμ μΌλ‘ κ΄κ³λ₯Ό λ§Ίμ μ μλ€. μλ₯Ό λ€μ΄, μμ²ν μ¦λΆ μΌ μΆμ², μ¬μ κ³ κ° μ§μ μ 곡 λ±μ΄ μλ€.
β― Causal Inference: Question of Why
• AI λ λ°μ΄ν°μ μκ΄κ΄κ³ ν¨ν΄μ νμ΅νλ€. μΈλΆνκ²½μ λ°λ₯Έ λ°μ΄ν°μ λ³νλ ν¨ν΄ λ³νκ° μ μ λΆμΌ (NLP, vision, collaboration filtering) μμλ μ±λ₯μ΄ λ°μ΄λλ€. κ·Έλ¬λ λΆλ₯,μμΈ‘,μΆμ²μ κ²°κ³Όκ° μ λμλμ§μ λν΄μλ κΆκ·Ήμ μΌλ‘ μ€λͺ νμ§ λͺ»νλ€.
• XAI λ‘λ μΈκ³Όκ΄κ³λ μ μ μλ€.