1️⃣ AI•DS176 1. Machine learning-based estimation of heterogeneous Treatment Effects and Motivating examples ◯ 실습 따라 공부한 노트북 https://colab.research.google.com/drive/1gM9uiyTwW80ZhWGqXkK_PbVXQGGfacTR?usp=sharing EconML day1 .ipynb Colaboratory notebook colab.research.google.com ① ML based estimation of heterogeneous Treatment Effects • 머신러닝의 가장 큰 목적은 도메인 응용에서 의사결정을 자동화 하는 것이다. • 대부분의 데이터 기반의 personalized 된 의사결정 시나리오의 핵심적인 문제는 heterogeneous treatment effects 를 추정하는 것이다. (Intervention 의 효과는 무엇인가) • 가령 가격할.. 2023. 6. 27. [The Brave and True] 5. The Unreasonable Effectiveness of Linear Regression 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① All you need is regression ◯ Review • 인과추론에서 각 개인에게서 얻을 수 있는 결과 값은 Y0 (처치를 받지 않았을 때 얻는 결과), Y1 (처치를 받았을 때 결과) 이 있다. 그러나 T가 0이나 1로 정해지면 다른 하나의 결과는 영영 알 수 없게 된다. 때문에 개인에 대한 처치효과 δi = Y1i - Y0i 는 알 수 없다. • 그러나 평균적인 인과 효과 ATE 는 추정할 수 있다 : ATE = E[Y1 - Y0] • 여기서 일정한 처치효과 k 는 Y1i = Y0i + k 를 만족한다. k 가 양수라면 평균적으로 처치가 양의 효과를 가지고 있다고 말한다. • 편향 bias 때문에 평균의 차이.. 2023. 6. 27. 인과추론의 데이터 과학 - 인과추론을 위한 머신러닝 모델 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! • Econ ML : Microsoft EconML • Causal Graph : Microsoft DoWhy → 메뉴얼을 읽고 논문을 읽어보는 것을 추천 • Multi-armed Bandits : 온라인 파이프라인 구축이 까다롭고 이를 할 수 있는 코딩 능력이면 프레임은 별 의미 없음 ① ECON ML models (Potential outcomes) • 인과 관계/구조를 이미 알고있다고 가정한다. • 접근 방식은 각기 다르지만, 비슷한 목적을 달성하기 위해 존재하는 모델들이다. A/B testing 이 되는 환경에서 EconML 을 적용해보면 좋다. (Same Goal, Different approach) ◯ ML 모델 기.. 2023. 6. 26. [The Brave and True] 4. Graphical causal model 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 인과에 대해 생각해보기 ◯ Potential outcome 에 대한 조건부 독립 가정 • 조건부 독립 가정은 오직 처치에 의한 효과를 측정할 수 있게 한다 • X에 대한 conditioning : 가령 약을 처방할 때, 심각한 케이스의 환자와 덜 심각한 케이스의 환자로 하위 그룹을 나누고 약의 효과를 분석한다면 더 명확한 그림을 얻을 수 있다. ◯ 인과 그래프 모형 ② 그래프 모델 • [참고] Coursera Stanford 강의 : Probabilistic Graphical models • 그래프 모형이 수반하는 독립성과 조건부 독립성 가정이 무엇인지에 대해 이해하는 것이 매우 중요하다. ◯ Blocked • Y가 조건화.. 2023. 6. 26. 대체로 해롭지 않은 계량경제학 정리 - Part2 핵심 - 3장 👀 계량경제학 개인 공부용 포스트 글 입니다. 3장. 이치에 맞는 회귀분석 구성 ① 회귀분석의 근본 원칙 a. 서론 • 처치집단과 통제집단 간의 차이를 추정하는 계산 방법으로서 회귀모형 • 회귀분석에서는 설명변수들이 통제될 수도 혹은 통제되지 않을 수도 있다. • 무작위 배정의 도움이 없는 경우, 회귀분석의 추정치들은 인과관계로 해석될 수도 있고 그렇지 않을 수도 있다. • 어떤 조건 하에서 회귀분석의 결과가 인과관계로서 해석될까 • 회귀 추정치들의 특성들에는 모집단 회귀함수 (population regression function) 와 조건부 기대함수 (conditional expectation function) 사이의 밀접한 관계와 회귀추정치의 표본분포가 포함되어 있다. b. 경제적 관계과 조건부 기.. 2023. 6. 26. [The Brave and True] 3. The-Most-Dangerous-Equation 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① Intro • 예제. 교육 데이터 : ENEM 점수(SAT와 유사한 브라질 표준 고등학교 점수)를 3년 동안 다른 학교들에서 수집 ⇨ 학생 규모가 작을 때 상위 1%에 해당하는 학교가 많았다. 그러나 하위 1% 학교를 살펴보았을 때도 학생수가 매우 적었다. 이는 학생 수가 적은 학교들의 경우, 분산이 크기 때문에 예측이 불확실해서 운에 의해 매우 높거나 낮은 분포를 보인 것이다. • 불확실성을 계산하는 방법 중 하나는 분산의 추정량을 구하는 것이다. 불확실성은 관측된 데이터가 클 수록 줄어든다. ATE 를 포함한 어떠한 요약 통계에 대해서도 이는 마찬가지다. 표본이 커질수록 분산은 줄어든다. ② Standard error .. 2023. 6. 22. 인과추론의 데이터 과학 - ML for Causal inference : 인과추론 기반의 예측 모델링 평가 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① Evaluating Recommendation algorithms in Netflix • 실제로 산업 현장에선 알고리즘에 대한 Evaluation 이 A/B test 로 이루어지고 있다. • Test set 에서의 효과가 실제 비즈니스 현장에 적용했을 때까지 그대로 나타나려면, 사람들이 새로운 알고리즘에 대해 이전과 동일한 행동양상으로 대응할 것이라는 가정이 만족되어야 하는데, 실제로는 그렇지 않다. 따라서 Test set 에서 좋은 성능을 보였다 하더라도, 실제로는 performance 가 나오지 않을 수 있다. 따라서 과거 데이터에서 ofline experiment 를 한 후에, 과거의 알고리즘과 새로운 알고리즘 사이의.. 2023. 6. 21. [The Brave and True] 2. Randomized Experiments 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① The golden standard • E(Y0 | T=0) = E(Y0 | T=1) 를 만족할 때 Bias 가 없다. 즉, 타겟군과 대조군이 처치를 받은 것을 제외하고 동등하거나 유사하면 인과관계가 성립한다. • 위와 같은 이론을 만족시킬 첫번 째 도구로는 Randomized experiments 가 있다. 무작위 실험은 Treatment Group과 Control group에 개개인을 랜덤하게 분배하는 방식이다. 이때 처치를 받는 타겟군의 비율이 꼭 50%일 필요는 없다. 랜덤하게 분배함으로써 potential outcome 을 treatment 로부터 독립적으로 만들어 bias 를 제거한다. • 무작위 실험에서는 tr.. 2023. 6. 21. [The Brave and True] 1. Introduction to causality 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 인과추론에 관심을 가져야 하는 이유 • 머신러닝은 인과관계 유형의 문제를 잘 다루지 못한다. 가령 호텔 산업에선, 가격이 비수기일때 저렴하고 성수기일때 높다. 머신러닝이 Naive 한 prediction 을 하게 되면 가격을 인상했을 때 더 많은 객실이 팔릴 것이라 제안할 수 있다. • 인과추론은 Counterfactual 이라 부르는 "만약에" 라는 질문에 답할 것을 요구한다. • 머신러닝은 상관관계 유형 예측에 의존하여 인과추론의 문제를 해결할 수 없다. 상관관계와 인과관계는 다르다. ② Notation ◯ 예제 • 학생들에게 태블릿을 제공했을 때 성과에 미치는 인과효과 밝혀내기 ◯ Ti • unit i 에 대한 Tre.. 2023. 6. 20. [industry] 인과추론 활용 : Best practice 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 발표 배경 ttps://playinpap.gitbook.io/dowhy/ DoWhy | 인과추론을 위한 라이브러리 - DoWhy | 인과추론을 위한 라이브러리 DoWhy는 인과추론을 위한 메커니즘을 4단계로 구성했습니다. 1단계 (Model)에서는 데이터를 인과 그래프로 인코딩하고, 2단계 (Identify)에서는 모델의 인과 관계를 식별하고 원인을 추정합니다. 3단계 playinpap.gitbook.io ↪ Microsoft의 인과추론을 위한 라이브러리 DoWhy의 가이드를 스터디하며 한국어 자료로 생성한 깃북 ※ 라이브러리 ※ 논문 ② 실무 인과추론의 위계 ◯ 인과추론의 best practice • 가능하다면 Rando.. 2023. 6. 20. 이전 1 2 3 4 5 6 7 8 ··· 18 다음 728x90