본문 바로가기

1️⃣ AI•DS176

계량경제학 강의_한치록_단순회귀 4장 👀 계량경제학 개인 공부용 포스트 글입니다. • 표본추출을 반복하여 시행하고 표본추출시마다 추정값을 계산 4. 추정값과 참값의 관계 ① 표본을 반복 추출 • 우리의 관심사는 모집단의 속성을 나타내는 모수 (파라미터) 이다. 그러나 모집단을 관측할 수 없으며, 일부인 표본만을 관측한다. • OLS 같은 하나의 추정 방법으로 표본에 대해 추정값을 계산하면, 데이터마다 상이한 추정값을 얻게 되고, 이들을 모두 모으면 하나의 분포가 형성될 것이다. 한 추정량에 대해 무한히 반복하며 얻는 추정값들의 분포를 Sampling distribution 이라고 한다. ② 표본추출 반복시행 시 추정값들의 분포 • 모집단과 반복적인 표본추출 방식에 대해 아래와 같은 가정들을 세운다. 1️⃣ 설명변수 값들에 대한 가정 • 설명.. 2023. 5. 12.
인과추론과 데이터사이언스 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 글1 : 인과성, 인공지능, 기계학습, 데이터 사이언스 • 인공지능은 어떤 에이전트가 목표를 성취하기 위해 주어진 환경에서 합리적인 액션을 취하는 것이다. 이때 환경에 변화를 주어, 원하는 상태로 변화시키는 인과관계로 해석이 가능하다. 기계학습은 데이터의 상관성을 학습하는 것인데, 이때 인과관계를 통해 해석하는 것도 가능하다. 데이터를 통해 풀고자 하는 질문에 따라 다르겠지만, 어떤 데이터를 수집하고 처리, 분석하고 해당 결과를 인간과 어떻게 상호작용할 것인가 하는 많은 부분에서 상관성과 인과성 모두 복합적으로 고려한다. ◯ Pearl's Causal Hierarchy (1) Associational or Observati.. 2023. 5. 12.
계량경제학 스터디 Lecture 3. Matching 👀 계량경제학 개인 공부용 포스트 글입니다. 1. Treatment conditional on covariates ① Conditional Independence Assumption ◯ Motivation • treatment effect 의 신뢰성을 어떻게 측정할까 ▸ Cetris Paribus : all else being equal ▸ Treatment 는 treatment 와 control group 의 유일한 차이여야 한다. (다른 건 다 동일) • treatment 가 모든 setting 에서 진짜로 random 할까 ▸ observational study 뿐만 아니라, lab experiment 에서도 treatment 는 randomly 하게 할당되지 않을 수 있다. ▸public poli.. 2023. 5. 12.
계량경제학 강의_한치록_단순회귀 3장 👀 계량경제학 개인 공부용 포스트 글입니다. • 모수에 대응하는 숫자를 표본으로부터 구하는 것을 estimation 추정 이라고 한다. 추정 공식을 estimator (추정량) 이라고 하고, 공식을 실제 자료에 적용해 값을 구하면 추정값 (estimate) 라고 한다. 3. 단순회귀 모형의 추정 ① 자료 • (x1,y1), (x2,y2), ..., (xn,yn) → 관측된 표본 ② 직선 그리기 • 회귀식을 추정하여 구한 기울기 추정값이 자동적으로 인과관계를 나타내지는 않는다는 점을 명심해야 한다. ③ 최소제곱법 ◯ 최소제곱법 • 수직 방향거리를 제곱하여 합한 값을 가장 작게 만들도록 절편과 기울기를 결정한다. OLS 라고도 부른다. 각 점들로부터 직선까지 수직방향 거리를 구하고 이들을 모두 제곱해 합한 .. 2023. 5. 11.
계량경제학 강의_한치록_단순회귀 2.5~2.7장 👀 계량경제학 개인 공부용 포스트 글입니다. 2. 단순 선형회귀 모형과 그 해석 ⑤ 기울기에 대한 자세한 설명 • Y = β0 + β1•X + u • E(u|X) = 0 이면 β1 은 X가 1 단위 높을 때 Y가 평균 얼마만큼 높은지 나타낸다. • 가령 X가 교육연수, Y가 임금 (만원단위) 라고 했을 때, 교육연수가 1년 차이나는 두 집단 간에는 평균 β1 만원 만큼의 임금차이가 있다고 해석해볼 수 있다. 만일 β1=0 이라면 교육연수는 임금에 평균적으로 어떤 영향도 미치지 않는다. • 반면 X가 이진변수일 때, 에를들어 자가용 이용여부 (1:자가용 이용, 0: 대중교통이용) 이고 Y가 출근에 걸린 시간 (단위 1시간) 이라고 한다면, X가 0에서 1로 증가할 때 (대중교통으로 출근하다 자가용으로 출근.. 2023. 5. 10.
계량경제학 스터디 Lecture 2. Regression 👀 계량경제학 개인 공부용 포스트 글입니다. 1. Review and Motivation ① Review ◯ ATT + selection bias • difference between treat and control = avg. causal effect (ATT) + selection bias • observed difference = causal effect 가 될 때 (= selection bias 를 무시할 수 있을 때) • treatment 가 outcome 에 독립일 때 : randomization 과 같이 결과에 관계없이 할당될 때 ◯ 예시 ↪ E(y0i | Di) ▸ Di=1 일 때 : (30/100)*1 + (70/100)*(-1) = -0.4 ▸ Di=0 일 때 : (70/100)*1 +.. 2023. 5. 10.
R 강좌 : 정책효과 분석 : 이중차분법 DiD, 삼중차분법 DDD 👀 계량경제학 개인 공부용 포스트 글 입니다. 강좌영상 ① 더미변수 ◯ 더미변수 • 남여 임금격차 : Y = α + β•Educ + ϒ•male + u • Y = α + β•Educ + ϒ•male + u Y_m = α + β•Educ + ϒ•1 + u Y_f = α + β•Educ + ϒ•0+ u ----------------------------------------- Y_m - Y_f = ϒ → 해석 : 여성에 비해 남성은 ϒ 만큼 임금을 더 (덜) 받는다. • 로그 차분인 경우에는 상대적 변화율을 의미한다 : lnY = α + β•Educ + ϒ•male + u ↪ lnYm - lnYf = (Ym - Yf)/Yf = 여성대비 남성 임금의 상대적 변화율 = 100•ϒ ↪ 해석 : 여성에 비해 남성은.. 2023. 5. 9.
계량경제학 강의_한치록_단순회귀 1장~2.4장 👀 계량경제학 개인 공부용 포스트 글입니다. 1. 준비 ① 계량경제학 근본 문제 • 모집단 : 관심의 대상이 되는 집단 • 모집단 전체를 관측할 수 없는 대신, 모집단으로부터 추출된 일부 관측값들 자료 (데이터) 를 가지고 있다. • 모집단에 관심을 가지면서도 모집단을 분석하지는 못하고 극히 일부 자료만을 분석하고 그 결과에 의존하여 모집단에 대한 추론을 해야 한다는 것이 계량경제학의 근본문제이다. ② 인과관계 • 계량경제학은 흔히 인과적 영향에 관심을 갖는다. • 인과적 영향이란 "다른 조건이 같고 ceteris paribus 하나의 요소만 다를 때의 차이" 를 의미한다. • 인과적 영향은 다른 면은 모두 동일하고 해당 요인만 다른 완벽한 쌍둥이를 비교함으로써 측정할 수 있을 것이다. 자연과학이나 공학.. 2023. 5. 9.
계량경제학 스터디 Lecture 1. Introduction 👀 계량경제학 개인 공부용 포스트 글입니다. 1. Overview ① Outline • Part1. Causality basics ↪ potential outcomes framework, randomized controlled trials, regression, matching • Part2. Tools of Trade ↪ IV, DID, RD (regression discontinuity) • Part3.Topics ↪ standard errors, robust estimation, ML and causal inference • Importance of causal inference • Potential outcomes framework • Selection bias • Randomization • A.. 2023. 5. 8.
[Causal ML] Causal inference 고려대 산공 세미나 내용정리 • 본문 내용에 대한 출처 ① 상관관계와 인과관계 ◯ 상관관계와 인과관계 • 상관관계 : 통계적 변수와 다른 변수들이 covariance (공변) 하는 관계 ⇨ 예측 목적 • 인과관계 : 선행하는 한 변수가 후행하는 다른 변수의 원인이 되고 있다고 믿어지는 관계 ⇨ 원인설명 목적 • AI 는 데이터의 상관관계 패턴을 학습한다. 외부 환경에 따른 데이터의 변화나 패턴 변화가 적은 분야에서는 상관관계를 학습하는 것만으로도 성능이 뛰어나다 (NLP, vision, collaboration filtering) • 그러나 왜 그러한 결과가 나왔는지에 대해서는 설명하지 못한다. ◯ 예시 • 구독갱신여부를 예측하는 모델링을 진행한 후 SHAP 기반의 변수 중요도를 그려본 그림은 아래와 같다. 광고지출, 버그 리포트,.. 2023. 5. 7.
728x90