본문 바로가기

분류 전체보기333

6월 셋째주 신문읽기 1️⃣ 산업 🔹 중국 알리바바, 유럽 진출 • 중국을 대표하는 글로벌 이커머스 기업인 알리바바는 최근 유럽 활로 개척을 공식화했다. • 알리바바는 이커머스 외에도 미디어, 물류, 클라우드 서비스 등 다양한 사업을 영위중이다. 이커머스의 경우 다양한 국가에서 여러 종류의 서비스를 운영하고 있다. • 해외 이커머스 사업은 글로벌 디지털 커머스에서 담당하고 있다. 알리 익스프레스 외에도 동남아, 터키, 남아시아 등에서 현지화된 플랫폼을 운영하고 있다. 🔹 전기차 충전시장 • 국내 대기업들이 전기차 충전 인프라 시장에 뛰어들고 있다. • 전기차 충전 시장은 충전을 위한 전력사업, 충전기 제조 및 설치 사업, 충전 인프라 사업으로 이루어져있다. SK, LG, 현대차 등 국내 기업은 이중 충전 인프라 사업에 힘쓰고.. 2023. 6. 23.
[The Brave and True] 3. The-Most-Dangerous-Equation 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① Intro • 예제. 교육 데이터 : ENEM 점수(SAT와 유사한 브라질 표준 고등학교 점수)를 3년 동안 다른 학교들에서 수집 ⇨ 학생 규모가 작을 때 상위 1%에 해당하는 학교가 많았다. 그러나 하위 1% 학교를 살펴보았을 때도 학생수가 매우 적었다. 이는 학생 수가 적은 학교들의 경우, 분산이 크기 때문에 예측이 불확실해서 운에 의해 매우 높거나 낮은 분포를 보인 것이다. • 불확실성을 계산하는 방법 중 하나는 분산의 추정량을 구하는 것이다. 불확실성은 관측된 데이터가 클 수록 줄어든다. ATE 를 포함한 어떠한 요약 통계에 대해서도 이는 마찬가지다. 표본이 커질수록 분산은 줄어든다. ② Standard error .. 2023. 6. 22.
인과추론의 데이터 과학 - ML for Causal inference : 인과추론 기반의 예측 모델링 평가 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① Evaluating Recommendation algorithms in Netflix • 실제로 산업 현장에선 알고리즘에 대한 Evaluation 이 A/B test 로 이루어지고 있다. • Test set 에서의 효과가 실제 비즈니스 현장에 적용했을 때까지 그대로 나타나려면, 사람들이 새로운 알고리즘에 대해 이전과 동일한 행동양상으로 대응할 것이라는 가정이 만족되어야 하는데, 실제로는 그렇지 않다. 따라서 Test set 에서 좋은 성능을 보였다 하더라도, 실제로는 performance 가 나오지 않을 수 있다. 따라서 과거 데이터에서 ofline experiment 를 한 후에, 과거의 알고리즘과 새로운 알고리즘 사이의.. 2023. 6. 21.
[The Brave and True] 2. Randomized Experiments 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① The golden standard • E(Y0 | T=0) = E(Y0 | T=1) 를 만족할 때 Bias 가 없다. 즉, 타겟군과 대조군이 처치를 받은 것을 제외하고 동등하거나 유사하면 인과관계가 성립한다. • 위와 같은 이론을 만족시킬 첫번 째 도구로는 Randomized experiments 가 있다. 무작위 실험은 Treatment Group과 Control group에 개개인을 랜덤하게 분배하는 방식이다. 이때 처치를 받는 타겟군의 비율이 꼭 50%일 필요는 없다. 랜덤하게 분배함으로써 potential outcome 을 treatment 로부터 독립적으로 만들어 bias 를 제거한다. • 무작위 실험에서는 tr.. 2023. 6. 21.
[The Brave and True] 1. Introduction to causality 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 인과추론에 관심을 가져야 하는 이유 • 머신러닝은 인과관계 유형의 문제를 잘 다루지 못한다. 가령 호텔 산업에선, 가격이 비수기일때 저렴하고 성수기일때 높다. 머신러닝이 Naive 한 prediction 을 하게 되면 가격을 인상했을 때 더 많은 객실이 팔릴 것이라 제안할 수 있다. • 인과추론은 Counterfactual 이라 부르는 "만약에" 라는 질문에 답할 것을 요구한다. • 머신러닝은 상관관계 유형 예측에 의존하여 인과추론의 문제를 해결할 수 없다. 상관관계와 인과관계는 다르다. ② Notation ◯ 예제 • 학생들에게 태블릿을 제공했을 때 성과에 미치는 인과효과 밝혀내기 ◯ Ti • unit i 에 대한 Tre.. 2023. 6. 20.
[industry] 인과추론 활용 : Best practice 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 발표 배경 ttps://playinpap.gitbook.io/dowhy/ DoWhy | 인과추론을 위한 라이브러리 - DoWhy | 인과추론을 위한 라이브러리 DoWhy는 인과추론을 위한 메커니즘을 4단계로 구성했습니다. 1단계 (Model)에서는 데이터를 인과 그래프로 인코딩하고, 2단계 (Identify)에서는 모델의 인과 관계를 식별하고 원인을 추정합니다. 3단계 playinpap.gitbook.io ↪ Microsoft의 인과추론을 위한 라이브러리 DoWhy의 가이드를 스터디하며 한국어 자료로 생성한 깃북 ※ 라이브러리 ※ 논문 ② 실무 인과추론의 위계 ◯ 인과추론의 best practice • 가능하다면 Rando.. 2023. 6. 20.
[industry] 인과추론에서 도메인의 역할과 교란변수 보정 출처 👀 인과추론 개인 공부용 포스트 글입니다. 출처는 첨부한 링크를 참고해주세요! ① 도메인과 인과추론 ◯ 인과추론은 도메인에 상당 부분 의존하는 방법론이다. Outcome 과 treatment 그리고 confounder (교란변수) 를 파악하는데 있어 도메인 지식은 필수다. ◯ data-driven 하게 변수 간 그래프 구조를 식별하기 위한 시도로 causal discovery 라는 방법이 있다. 그러나 이 방법도 제약이 없으면 작동하기 어렵고, 변수 간의 모든 조합을 고려하는 것은 계산량이 너무 많다. ◯ 인과추론 : 실험/처치/행동/정책이 가져온 효과를 정량적으로 분석 → 변수들 간의 모든 관계를 알 필요는 없다. treatment 를 추정할 때 교란변수를 보정 (모형에 추가) 했다는 사실이 중요.. 2023. 6. 15.
6월 둘째주 신문읽기 1️⃣ 산업 🔹 쿠팡과 반쿠팡 연합 • 이커머스 최강자 쿠팡이 식품 제조 최강자 CJ 제일제당과 갈등을 빚는 중이다. 결국 쿠팡이 CJ제일제당의 제품을 납품받지 않는 상황까지 이르렀는데, 제품 가격 문제로 대립이 발생한 것으로 나타났다. • 쿠팡이 발주를 중단하며 해당 여파로 중소 및 중견기업의 즉석밥 제품 판매가 증가했다. CJ 제일제당은 쿠팡과의 거래를 끊고, 네이버 쇼핑 및 신세계와 손을 잡았다. • 쿠팡이 가격인하를 요구하며 거래를 중단하는 행위를 갑질이라 보는 시선도 있다. 쿠팡측은 기업의 독과점을 막기 위함이라 설명했지만, 이에 맞춰 경쟁사들도 최저 가격을 맞춰야하기 때문에 경쟁을 부추길 수 있다. 🔹 Open AI CEO 방한, 국내 AI 업계 주목 • 챗GPT 를 개발한 오픈 AI 의 CE.. 2023. 6. 15.
6월 첫째주 신문읽기 1️⃣ 산업 🔹 AI 기술 거부하는 웹툰 독자들 • 웹툰 및 웹소설 업계에서 AI 기술을 활용해 콘텐츠를 만드는 시도를 진행하고 있다. 웹툰 작가의 과도 노동 문제, 대형 스튜디오 종속 문제 등을 해결하기 위해 사용하는 목적도 있다. • 최근 네이버 웹툰 인기 작품에서 어색한 그림체 문제로 생성형 AI 논란에 휩싸이게 되었다. 제작사 측은 보정 작업에서만 AI 를 사용했다고 인정하였는데, 전체 제작과정에서 사용되었다는 의심은 끊이지 않고 있다. • 저작권 문제, 불쾌한 골짜기 유발, 창작 영역에 대한 AI 활용 반감 등 독자들의 반발 의견이 팽배해지고 있다. • AI 에 대한 부정적 여론을 의식한 네이버와 카카오는 공모전에서 AI 활용을 금지하기도 했으며 정치권에서도 관련한 규제의 필요성을 점차 논의하고.. 2023. 6. 9.
Uplift modeling 참고 아티클1 참고 아티클2 • 업리프트 모델은 treatment 반응으로 얻을 수 있는 점진적 가치 ( incremental value ) 를 예측한다. https://pylift.readthedocs.io/en/latest/index.html Welcome to pylift’s documentation! — pylift 0.1.3 documentation Welcome to pylift’s documentation! pylift is an uplift library that provides, primarily, (1) fast uplift modeling implementations and (2) evaluation tools. While other packages and more exact meth.. 2023. 6. 6.
728x90