1️⃣ AI•DS176 인과추론의 데이터 과학 - 이중차분법 참고영상 : Bootcamp 3-3. 이중차분법 DID(Difference-in-Differences)는 quasi-experimental design 중 하나입니다. Quasi-experimental design은 randomized controlled trial(RCT)과 같은 엄격한 실험적 설계가 적용되지 않은 경우를 말합니다. DID는 일반적으로 실제 실험적 조작을 가하지 않는 자연적인 사건, 예를 들어 정책 변화, 자연 재해 등이 발생한 경우를 이용하여 효과를 측정하는 것입니다. DID는 두 개 이상의 그룹을 비교하여 효과를 측정합니다. DID는 시간적으로 서로 다른 두 그룹이 있는 경우에 주로 사용됩니다. 실험 그룹과 대조 그룹의 특성이 서로 다르지 않은 것이 전제되어야 하며, 이를 위해 DI.. 2023. 4. 24. 인과추론의 데이터 과학 - 준실험 분석 방법론 참고영상 : Bootcamp 3-2. 준실험 분석 방법론 1. Counterfactual and methods ◯ Counterfactual revisited • 우리에게 필요한건, treatment group 에서 treat 를 받지 않았더라면 어떤 결과를 보였는지에 대한 counterfactual ⇨ 현실에서 관찰 불가능하기 때문에 가장 비슷한 control group 을 찾는 것이 관건이다. • Causal experiment method: control group 을 활용해 어떻게 counterfactual 을 유추할 수 있을지에 대한 방법 ⇨ Research design and apply method • 우리가 실제 데이터를 통해 추정하는 것은, treatment group 에 대한 ATE 인 .. 2023. 4. 24. 인과추론의 데이터 과학 - 디자인 기반의 인과추론 참고영상 : Bootcamp 3-1. 디자인 기반의 인과추론 1. Quasi-experimental designs ◯ Quasi-experiment designs • Research designs without random assignment : 무작위 실험을 할 수 없을 때, 이와 유사하게 실행될 수 있도록 하는 실험 • Quasi-experiment 나 Instrumental variable의 경우, 관찰되지 않은 값들까지 (selection bias) 고려하기 위해 research design을 도입한다. ◯ Random assignment is not always feasible • Quasi experiment 는 RCT와 거의 동일하다고 볼 수 있다. 다만, selection bias를 없애기.. 2023. 4. 24. 인과추론의 데이터 과학 - 매칭과 역확률 가중치 참고영상 : Bootcamp 2-4. 매칭과 역확률 가중치 1. Matching • Regression 은 control variable과 selection bias에 대해 linear form으로 가정하고, control variable을 conditioning 함으로써 특성을 유사하게 만들었다면 matching 은 functional form 없이 단순히 control variable에서 특성이 유사한 것들을 직접적으로 매칭하는 방법이다. 훨씬 더 직관적인 방법이라 볼 수 있다. Flexible 한 형태이다. • 즉, 회귀분석과 Matching 은 functional form 을 가정하느냐 안 하느냐의 차이만 존재한다. • Matching 을 하는 방법은 여러 가지가 있는데, 강의에서는 2가지만 소개.. 2023. 4. 21. 인과추론의 데이터 과학 - 인과추론 관점에서의 회귀분석 참고영상 : Bootcamp 2-3. 인과추론 관점에서의 회귀분석 1. Casual Hierarchy • 어떤 종류의 selection bias를 다룰 수 있는지에 대한 기준 • Selection on Observables strategies : 관찰 가능한 변수들에 의해서만 treatment와 control 이 선택된다는 가정을 가지고 관찰 가능한 변수들만을 가지고 selection bias를 설명하려는 경향 • Selection on Unobservables strategies : 관찰 가능하지 않은 교란 요인들도 적절한 실험디자인을 통해 해결하고자 하는 전략 ⇨ 좀 더 powerful 한 전략 2. How to balance between treatment and control groups ◯ Re.. 2023. 4. 21. 인과추론의 데이터 과학 - 무작위 통제 실험 참고영상 : Bootcamp 2-2. 무작위 통제실험 1. Random assignment • 랜덤하게 group 을 할당하면 집단 간 특성이 비슷해진다. ◯ Potential Outcomes 관점에서 인과추론의 수준 • 아래로 갈수록 인과추론을 증명하기 어려운 방법론, 위로 갈수록 증명하기 쉬운 방법론 • 가장 인과추론의 수준이 높은 것은 Randomized Controlled trial 이다. (RCT) • 현실 상황에서는 무작위 실험을 하기 어려운 경우가 많다. 따라서, 실험과 유사한 상황을 도입하는 것을 준실험 (Quasi-Experiment) 를 수행한다. 만약 준실험도 실행하기 어려운 상황이라면, 내생성을 제거하기 위한 통계적인 도구인 Instrumental variable 를 활용할 수 있다.. 2023. 4. 21. 인과추론의 데이터 과학 - 잠재적결과 프레임워크 참고영상 : Bootcamp 2-1. 잠재적 결과 프레임워크 1. Potential outcome framework ◯ Potential outcome framework • 특정 원인 (treatment) 의 인과적 효과를 잠재적 결과의 차이로서 정의하고 분석하는 것 • 그때의 결정이 원인이 되어 지금의 결과가 나옴. 그때의 결정이 달랐다라면 잠재적인 결과는 어떻게 되었을까 ⇨ 우리가 일상속에서 사고하는 방식이 Potential outcome 이 인과관계를 정의하는 방식이라 볼 수 있음 • Causal effect = (treatment 를 받은 실제 결과) - (treatment 를 받지 않았더라면 있었을 잠재적 결과) ◯ Counterfactual • treatment 를 받지 않았더라면 있었을 잠재.. 2023. 4. 21. The science of price experiments in the Amazon Store 원문 ◯ 아마존 스토어에서의 가격 실험 • 아마존 스토어의 상품의 가격은 수요,계절성,일반적인 경제적 트렌드와 같은 요소를 반영하고 있다. • 가격 정책도 그러한 부분을 중요하게 두고 있다. 새로운 가격 정책은 머신러닝 방법론을 많이 활용하고 있다. Amazon pricing labs 에서는 새로운 가격 정책을 평가하기 위해 온라인 A/B test 를 수행하고 있다. • 아마존 스토어를 방문하는 모든 소비자들이 동시에 모든 제품에 대해 동일한 가격에 구매할 수 있도록 하는 차별없는 가격 책정을 실천하고 있으므로, 각기 다른 고객에게 다른 가격을 제시하는 것이 아니라 시간이 지남에 따라 제품 가격에 대한 실험적인 처치를 적용해야 한다. ◯ Time-bound experiment • 새로운 가격 책정을 평가.. 2023. 4. 21. 인과추론의 데이터 과학 - 인과추론의 어려움과 인과추론 전략 참고영상 : Bootcamp 1-2. 인과추론의 어려움과 인과추론 전략 1. Challenges in causal inference • 상관관계는 인과관계를 의미하지 않는다. ◯ Ex1. 최저임금과 고용률 • 인과추론을 적용하기 매우 어려운 주제이고 갑론을박이 계속 이어지는 주제 • 최저임금에 대한 자연실험 연구 • 인과추론 연구의 약점 : external validity and transportability 다른 상황으로의 적용 ◯ Ex2. 추천시스템 • 알고리즘의 성과를 높이는 것뿐만 아니라, 이러한 알고리즘을 도입했을 때 실질적인 제품 판매 증가로 이어졌는가가 더 중요할 것 • 추천시스템을 개발하는 건 알고리즘적인 문제지만, 이러한 추천시스템을 도입할지 말지를 결정하는 것은 인과추론 문제가 될 수 .. 2023. 4. 20. 인과추론의 데이터 과학 - 인과추론과 예측 방법론의 차이 참고영상 : Bootcamp 1-1. 인과추론과 예측 방법론의 차이 1. 데이터 과학 : 인과추론 방법론 (ex. 계량경제학) + 예측 방법론 (ex.머신러닝) 2. 영화 "머니볼" • 야구 코치들은 선수들이 더 좋은 성과를 낼 수 있는 요인들 (causes) 을 찾고, 데이터사이언티스트들은 구체적인 선수에 대한 요인들에 상관없이 승리할 확률을 높이는 것을 더 중요하게 여긴다. • Prediction 과 causual inference 는 다르다. 3. 데이터과학/분석의 프레임워크 • Causual inference 가 필요한 경우 ↪ Input-Oriented approach ⇨ ex. 코로나 19 백신을 맞아야 되는지, 마케팅 프로모션을 진행해야 하는지, 정책을 도입해야 하는지 말아야 하는지 • Pr.. 2023. 4. 20. 이전 1 ··· 7 8 9 10 11 12 13 ··· 18 다음 728x90