본문 바로가기

분류 전체보기328

인과추론의 데이터 과학 - 준실험 분석 방법론 참고영상 : Bootcamp 3-2. 준실험 분석 방법론 1. Counterfactual and methods ◯ Counterfactual revisited • 우리에게 필요한건, treatment group 에서 treat 를 받지 않았더라면 어떤 결과를 보였는지에 대한 counterfactual ⇨ 현실에서 관찰 불가능하기 때문에 가장 비슷한 control group 을 찾는 것이 관건이다. • Causal experiment method: control group 을 활용해 어떻게 counterfactual 을 유추할 수 있을지에 대한 방법 ⇨ Research design and apply method • 우리가 실제 데이터를 통해 추정하는 것은, treatment group 에 대한 ATE 인 .. 2023. 4. 24.
인과추론의 데이터 과학 - 디자인 기반의 인과추론 참고영상 : Bootcamp 3-1. 디자인 기반의 인과추론 1. Quasi-experimental designs ◯ Quasi-experiment designs • Research designs without random assignment : 무작위 실험을 할 수 없을 때, 이와 유사하게 실행될 수 있도록 하는 실험 • Quasi-experiment 나 Instrumental variable의 경우, 관찰되지 않은 값들까지 (selection bias) 고려하기 위해 research design을 도입한다. ◯ Random assignment is not always feasible • Quasi experiment 는 RCT와 거의 동일하다고 볼 수 있다. 다만, selection bias를 없애기.. 2023. 4. 24.
인과추론의 데이터 과학 - 매칭과 역확률 가중치 참고영상 : Bootcamp 2-4. 매칭과 역확률 가중치 1. Matching • Regression 은 control variable과 selection bias에 대해 linear form으로 가정하고, control variable을 conditioning 함으로써 특성을 유사하게 만들었다면 matching 은 functional form 없이 단순히 control variable에서 특성이 유사한 것들을 직접적으로 매칭하는 방법이다. 훨씬 더 직관적인 방법이라 볼 수 있다. Flexible 한 형태이다. • 즉, 회귀분석과 Matching 은 functional form 을 가정하느냐 안 하느냐의 차이만 존재한다. • Matching 을 하는 방법은 여러 가지가 있는데, 강의에서는 2가지만 소개.. 2023. 4. 21.
인과추론의 데이터 과학 - 인과추론 관점에서의 회귀분석 참고영상 : Bootcamp 2-3. 인과추론 관점에서의 회귀분석 1. Casual Hierarchy • 어떤 종류의 selection bias를 다룰 수 있는지에 대한 기준 • Selection on Observables strategies : 관찰 가능한 변수들에 의해서만 treatment와 control 이 선택된다는 가정을 가지고 관찰 가능한 변수들만을 가지고 selection bias를 설명하려는 경향 • Selection on Unobservables strategies : 관찰 가능하지 않은 교란 요인들도 적절한 실험디자인을 통해 해결하고자 하는 전략 ⇨ 좀 더 powerful 한 전략 2. How to balance between treatment and control groups ◯ Re.. 2023. 4. 21.
인과추론의 데이터 과학 - 무작위 통제 실험 참고영상 : Bootcamp 2-2. 무작위 통제실험 1. Random assignment • 랜덤하게 group 을 할당하면 집단 간 특성이 비슷해진다. ◯ Potential Outcomes 관점에서 인과추론의 수준 • 아래로 갈수록 인과추론을 증명하기 어려운 방법론, 위로 갈수록 증명하기 쉬운 방법론 • 가장 인과추론의 수준이 높은 것은 Randomized Controlled trial 이다. (RCT) • 현실 상황에서는 무작위 실험을 하기 어려운 경우가 많다. 따라서, 실험과 유사한 상황을 도입하는 것을 준실험 (Quasi-Experiment) 를 수행한다. 만약 준실험도 실행하기 어려운 상황이라면, 내생성을 제거하기 위한 통계적인 도구인 Instrumental variable 를 활용할 수 있다.. 2023. 4. 21.
인과추론의 데이터 과학 - 잠재적결과 프레임워크 참고영상 : Bootcamp 2-1. 잠재적 결과 프레임워크 1. Potential outcome framework ◯ Potential outcome framework • 특정 원인 (treatment) 의 인과적 효과를 잠재적 결과의 차이로서 정의하고 분석하는 것 • 그때의 결정이 원인이 되어 지금의 결과가 나옴. 그때의 결정이 달랐다라면 잠재적인 결과는 어떻게 되었을까 ⇨ 우리가 일상속에서 사고하는 방식이 Potential outcome 이 인과관계를 정의하는 방식이라 볼 수 있음 • Causal effect = (treatment 를 받은 실제 결과) - (treatment 를 받지 않았더라면 있었을 잠재적 결과) ◯ Counterfactual • treatment 를 받지 않았더라면 있었을 잠재.. 2023. 4. 21.
The science of price experiments in the Amazon Store 원문 ◯ 아마존 스토어에서의 가격 실험 • 아마존 스토어의 상품의 가격은 수요,계절성,일반적인 경제적 트렌드와 같은 요소를 반영하고 있다. • 가격 정책도 그러한 부분을 중요하게 두고 있다. 새로운 가격 정책은 머신러닝 방법론을 많이 활용하고 있다. Amazon pricing labs 에서는 새로운 가격 정책을 평가하기 위해 온라인 A/B test 를 수행하고 있다. • 아마존 스토어를 방문하는 모든 소비자들이 동시에 모든 제품에 대해 동일한 가격에 구매할 수 있도록 하는 차별없는 가격 책정을 실천하고 있으므로, 각기 다른 고객에게 다른 가격을 제시하는 것이 아니라 시간이 지남에 따라 제품 가격에 대한 실험적인 처치를 적용해야 한다. ◯ Time-bound experiment • 새로운 가격 책정을 평가.. 2023. 4. 21.
4월 셋째주 신문읽기 1️⃣ 산업 🔹 (반도체) 인텔-ARM 동맹, 파운드리 시장 휘청 • 인텔과 ARM 이 손을 잡으며 파운드리 (반도체 위탁생산) 시장에 새로운 강자가 나타날 가능성이 높아졌다. • ARM 은 모바일 반도체 설계자산 IP 시장 강자로 스마트폰 개발에 필수적인 아키텍쳐를 제공하는 기업이다. 인텔의 동맹을 통해 고착된 시장구조에 변화가 찾아올지 관심이 쏠리고 있다. 🔹 (IT) x가 된 트위터 • 트위터가 일론머스크의 회사 X에 흡수합병되었다. • 슈퍼앱 제작의 촉진제로 보여지는 트위터는 최근 투자 중개사와 협력해 금융 서비스 제공을 시작했다. 13일부터 플랫폼에 주식과 코인 시세를 제공한다. • 텍스트 기반 SNS 인 트위터의 정체성이었던 글자수 제한도 이제는 1만자까지 길어졌다. 이를두고 트위터의 특성과 .. 2023. 4. 21.
인과추론의 데이터 과학 - 인과추론의 어려움과 인과추론 전략 참고영상 : Bootcamp 1-2. 인과추론의 어려움과 인과추론 전략 1. Challenges in causal inference • 상관관계는 인과관계를 의미하지 않는다. ◯ Ex1. 최저임금과 고용률 • 인과추론을 적용하기 매우 어려운 주제이고 갑론을박이 계속 이어지는 주제 • 최저임금에 대한 자연실험 연구 • 인과추론 연구의 약점 : external validity and transportability 다른 상황으로의 적용 ◯ Ex2. 추천시스템 • 알고리즘의 성과를 높이는 것뿐만 아니라, 이러한 알고리즘을 도입했을 때 실질적인 제품 판매 증가로 이어졌는가가 더 중요할 것 • 추천시스템을 개발하는 건 알고리즘적인 문제지만, 이러한 추천시스템을 도입할지 말지를 결정하는 것은 인과추론 문제가 될 수 .. 2023. 4. 20.
인과추론의 데이터 과학 - 인과추론과 예측 방법론의 차이 참고영상 : Bootcamp 1-1. 인과추론과 예측 방법론의 차이 1. 데이터 과학 : 인과추론 방법론 (ex. 계량경제학) + 예측 방법론 (ex.머신러닝) 2. 영화 "머니볼" • 야구 코치들은 선수들이 더 좋은 성과를 낼 수 있는 요인들 (causes) 을 찾고, 데이터사이언티스트들은 구체적인 선수에 대한 요인들에 상관없이 승리할 확률을 높이는 것을 더 중요하게 여긴다. • Prediction 과 causual inference 는 다르다. 3. 데이터과학/분석의 프레임워크 • Causual inference 가 필요한 경우 ↪ Input-Oriented approach ⇨ ex. 코로나 19 백신을 맞아야 되는지, 마케팅 프로모션을 진행해야 하는지, 정책을 도입해야 하는지 말아야 하는지 • Pr.. 2023. 4. 20.
728x90