๐ Keyword
โฏ Quasi-experimental research design
• DiD
• DDD
• Probit model
• Hazard model
โฏ Matching
• CEM : ๋จ์ํ๊ฒ ํต์ ๋ณ์๋ค์ด ๋น์ทํ ๊ด์ธก์น๋ผ๋ฆฌ ๋งค์นญํ๋ ๋ฐฉ๋ฒ
• PSM : ํต์ ๋ณ์๊ฐ ์ฃผ์ด์ง ์ํ์์ Treatment ๋ฅผ ๋ฐ์ ํ๋ฅ (Propensity score) ์ด ๋น์ทํ ๊ด์ธก์น๋ผ๋ฆฌ ๋งค์นญ
• EDM : ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ธฐ์ค์ผ๋ก ๋งค์นญ
๐ ๋ฐ์ดํฐ ํด์์ ์ํ ๋๋ฉ์ธ ์ง์
โฏ The hype machine
• Largest MP3 blog aggregator ๋ก ๋ธ๋ก๊ทธ์ ํฌ์คํ ๋ ์์ /ํธ๋ ๋ฆฌ์คํธ๋ค์ ์์งํ์ฌ ๊ด๋ จ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค. ์ ์ ๋ค์ ์์ ์ ์คํธ๋ฆฌ๋ฐ ํ ์ ์์ผ๋ฉฐ, ์์ ๋ค์ด๋ก๋๋ ๋ถ๊ฐ๋ฅํ๋ค.
• ์ฐ๊ตฌ๋ฅผ ์งํํ ์์ ์์ 15~20% ์ ํด๋นํ๋ ์ ์ ๋ค๋ง social networking ๊ธฐ๋ฅ๋ค์ ์ฌ์ฉํ๊ณ ์์๊ณ ๋๋จธ์ง ์ ์ ๋ค์ isolate (๋ค๋ฅธ ์ ์ ๋ค์ ํ๋ก์ฐ ํ์ง ์์) ๋์ด ์์๋ค.
• Popularity information ์ ์น์ฌ์ดํธ์ ๋ชจ๋ ์ ์ ๋ค์๊ฒ 10์ 1์ผ์ ๊ธฐ์ ์ผ๋ก ๋ชจ๋์๊ฒ ๋ณด์ฌ์ก๋ค. 10์ 1์ผ ์์ ์ด์ ์๋ ์ ์ ๋ค์ ์ข์์๋ฅผ ๋๋ฅผ ์ ์์๋ค. (favorites ์ซ์๋ ๋ณผ ์ ์์์)
• ์ ์ ๋ค์๊ฒ social network ๋ฅผ ์์ฑํ ์ ์๋ ๊ฐ๋ณ์ ์ธ ๋์๋ณด๋๋ฅผ ์ ๊ณตํ๋๋ฐ, ์ข์ํ๋ ํธ๋์ด๋ ์ ์ ๋ฅผ ์ถ๊ฐํ ์ ์๋ค. (add favorite tracks and favorite users) ์ ์ ๋ฅผ favorite ํ๋ ๊ฒ์ following ๊ณผ ๋น์ทํ ํ๋์ด๋ค. (์ผ๋ฐฉํฅ ํ๋ก์ฐ๋ ๊ฐ๋ฅ)
โ Abstract
โฏ Research Topic
• ์จ๋ผ์ธ ์์ ์ปค๋ฎค๋ํฐ์์ ๋ฐ์ํ๋ ์์ ์๋น์ ์์ด Popularity influence (๋์ค์ฑ) ์ Proximity influence (๊ทผ์ ์ฑ) ๊ฐ ๋ฏธ์น๋ ์ํฅ
โฏ Research Question
• RQ1. How does popularity influence affect music consumption choices?
• RQ2. Is popularity influence more important for mainstream or niche music?
• RQ3. How important is proximity influence on music consumption?
• RQ4. What is the nature of the interaction between the two types of influence? Are they complements or substitutes?
โฏ Research Method
• quasi-experimental research design
• highly granular data from an online music community
โฏ Research Results
• Popularity influence ์ Proximity influence ๋ชจ๋ ์์ ์๋น์ Positive ํ ์ํฅ์ ๋ผ์นจ์ ์ฆ๋ช
• ๋ ์ํฅ์ ์๋ก substitute ๊ด๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, Proximity ์ํฅ์ด ์๋ ๊ฒฝ์ฐ Popularity ์ํฅ์ ๋ฐ์ด ๋๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค.
โฏ Research Contribution
• Design and marketing strategies for online communities
โก Introduction
โฏ Preliminary
• Total favorites → Popularity influence, Friend favorites → Proximity influence
• ex. A ์ ์ ๊ฐ ์ค์ฌ ์ ์ ์ ํด๋นํ ๋, Song1 ์ ๊ฒฝ์ฐ ์ด 5๋ช ์ ์ ์ ๋ค์ด ์ข์ํ๊ณ , A์ ์ ์ ์น๊ตฌ๋ฅผ ๋งบ๊ณ ์๋ ์ ์ ์ค์๋ C๋ง ์ข์์๋ฅผ ๋๋ ๋ค. Song2 ์ ๊ฒฝ์ฐ ์ด 2๋ช ์ ์ ์ ๊ฐ ์ข์ํ๊ณ , A์ ์ ์ ์น๊ตฌ์ธ ์ ์ ๋ค ์ค์๋ ํด๋น ๋ ธ๋๋ฅผ ์ข์์๋ฅผ ๋๋ฅธ ์ฌ๋์ด ์๋ค.
โฏ Research Design
• Popularity influence → ์ ์ ์ ์ข์์ ํ๋ ์ง๊ณ๋ฅผ "๋ณด์ด๊ฒ ํ ๊ธฐ๋ฅ" (์ด ์ข์์ ์๊ฐ ๋ณด์ด๋์ง ์ฌ๋ถ) ์ ๋์์ผ๋ก ํ์ฌ ๋ถ์์ ์งํ : CEM matching and DiD
• Proximity influence → ํ๋ก์ฐํ ์น๊ตฌ์ ํน์ ๋ ธ๋์ ๋ํ ์ข์์๋ฅผ ๋๋ฅธ ํ๋ (focal user ๊ฐ ์ข์ํ๋ ๋ ธ๋๋ฅผ ์ฃผ๋ณ ์น๊ตฌ๋ค๋ ์ข์ํ๊ณ ์๋์ง ์ฌ๋ถ) ์ ๋์์ผ๋ก ๋ถ์์ ์งํ : PSM or EDM matching and Probit model, Hazard model
โข Literature Review
โฏ Popularity influence
• Online Word of mouth (Mizerski 1982, Chevalier and Mayzlin 2006, Liu 2006)
• Observational learning (Sorenson 2007, Duan et al. 2009, Salganik et al. 2006)
โจ In study, the number of favorites for a song is hybrid of WOM and OL
โฏ Proximity influence
• Influence in social networks (Brown et al. 1987, Valente 1995, Katz et.al 1955, Granovetter 1973)
• Separating social influence and homophily : Aral et al.2009 (Dynamic matched sample estimation) โญ
โฃ Methodology
โฏ Data
• The hype machine ์ด๋ผ๋ ์์ ์ปค๋ฎค๋ํฐ์์ ๋ฐ์ดํฐ๋ฅผ ์์ง
• Popularity influence : Feature implementation (์ข์์ ์๋ฅผ ๋ณด์ด๊ฒ ํ ๊ธฐ๋ฅ) ์ ๋์ ํ ์์ ์ ํ๋ฅผ ๊ธฐ์ค์ผ๋ก, Song level ์์ ํน์ ์์ ์ ๋ํ ์ด ์ฒญ์ทจ ํ์๋ฅผ ์ถ์
• Proximity influence : User-song level ์์ ํน์ ์ ์ ๋ฅผ ๊ธฐ์ค์ผ๋ก ํน์ ์์ ์ ๋ํด, ์ฃผ๋ณ ์น๊ตฌ๋ค๋ ์ข์์๋ฅผ ๋๋ ๋์ง ์ฌ๋ถ๋ฅผ ๊ธฐ์ค์ผ๋ก ์์ ์ฒญ์ทจ ์ฌ๋ถ๋ฅผ ์ถ์
• Descriptive statistics
โฏ Variable
• Popularity influence → DiD (Song level)
โช Listens_jt : song j ์ ๋ํ time t ์์ ์ ์ด ์ฒญ์ทจ ํ์
โช PopTreatment_j : song j ์ ๋ํ ์ด ์ข์์ ๊ฐ์๊ฐ ๋ณด์ด๋์ง์ ๋ํ ์ฌ๋ถ
โช After_t : popularity treatment ์ดํ ์์ ์ธ์ง์ ๋ํ ์ฌ๋ถ (์ด ์ข์์ ๊ฐ์๊ฐ ๋ณด์ด๋ ๊ธฐ๋ฅ ๋์ ์์ ์ดํ)
• Proximity influence (User-song level)
โช Listen_ij : ์ ์ i ์ด song j ๋ฅผ ๋ค์๋์ง ์ฌ๋ถ
โช ProxTreatment_ij : ์ ์ i ์ ํ๋ก์ฐ ์น๊ตฌ ์ค์ song j ์ ๋ํด ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋์ง ์ฌ๋ถ (0์ด๋ฉด ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ํ ๋ช ๋ ์๋ค๋ ๊ฒ์ ๋ปํจ)
โช Friends_i : ์ ์ i ๊ฐ ํ๋ก์ฐํ๊ณ ์๋ ์ด ์ ์ ์ ์
• Jointly model → DDD (User-song granularity level)
โช Listen_gjt : group g (์ฃผ๋ณ์ ํด๋น ์์ ์ ์ข์ํ๋ ์น๊ตฌ๊ฐ ์๋์ง ์ฌ๋ถ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ง๋จ์ ๊ตฌ๋ถ) ์ ๋ํด t ์์ ์ song j ๋ฅผ ์ฒญ์ทจํ ์ด ํ์ ๐ Popularity ์ Proximity ๋ฅผ ๋์์ ๊ณ ๋ ค
โป g : index of proximity treatment (0 or 1)
โจ g = 1 ์ด๋ฉด ProxTreatment = 1, g=0 ์ด๋ฉด ProxTreatment = 0
โช PopTreatment_j : song j ์ ๋ํ popularity influence treated ์ฌ๋ถ (์ข์์ ์ ๋ณด์ด๋ ๊ธฐ๋ฅ ์ ์ฉ์ฌ๋ถ)
โช After_t : 10์ 1์ผ ์ดํ๋ฉด 1, ์๋๋ฉด 0
โช ProxTreatment_gj : group g ์ ์ํ๋ ์ ์ i ๊ฐ song j ์ ๋ํด ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋ค๋ฉด 1, ์๋๋ฉด 0
• Control variable
โช PreFavorites_j : song j ์ ๋ํด ์ฐ๊ตฌ ๊ด์ธก ์์ ์ด์ ์ ๋ฐ์๋ ์ด ์ข์์ ๊ฐ์
โช SalesRank_j : ์๋ง์กด์ ์ฌ๋ผ์จ song j ์ ์ด ํ๋งค ์์
โช Genre_j : song j ์ ์ฅ๋ฅด
โฏ Model
โด Popularity influence
โข CEM
• Match the two groups of songs (๋งค์นญ ๋จ์ : Song, e.g. Song A - Song B)
• ๋งค์นญ ๊ธฐ์ค : ์ฅ๋ฅด, feature implementation ์ด์ ์์ ์ ์ด ์ข์์ ๊ฐ์, ์๋ง์กด ์๋ฐ ํ๋งค ์์ ๋ฑ ๊ด์ธก ๊ฐ๋ฅํ ํน์ฑ๋ค์ ๊ธฐ์ค์ผ๋ก ๋งค์นญ์ ์งํ
• ์ฅ๋ฅด๋ ์ ํํ ๋งค์นญ์ํค๋๋ก ํ๊ณ , ์ฐ์๋ณ์์ ํด๋นํ๋ ๋ณ์๋ค์ ์ต๋ํ ๊ทผ์ ํ ๊ฐ์ ๊ฐ์ง๋๋ก ๋งค์นญํ๋ค. (Stata ํด ์ฌ์ฉ)
• ๋งค์นญ์ ํตํด treatment group ๊ณผ control group ์ ์๋ imbalance ๊ฐ ๊ฐ์ํจ์ ํ์ธ
โข DiD setting
• Assumption : ์ข์์ ์๋ฅผ ๋ณด์ด๊ฒ ํ popularity influence ๊ฐ, ์์ ์๋น์ Positive ํ ์ํฅ์ ๋ฏธ์น ๊ฒ์ด๋ผ๊ณ ๊ฐ์ (ATE)
โ PopTreatment_j
• Treatment group : ์ข์์ ์๋ฅผ "๋ณด์ผ ์ ์๊ฒ ํ๋" ๊ธฐ๋ฅ์ ๋์ ํ ์์ ์ด 10์ 1์ผ์ด๊ธฐ ๋๋ฌธ์, ์ข์์ ์๊ฐ ์ด๋์ ๋ ์์ผ ์ ์๋๋ก 2008๋ 9์ 29์ผ์ ํฌ์คํ ๋ song ๋ค์ ๊ธฐ์ค์ผ๋ก data set ์ ๊ตฌ์ฑ
• Control group : ์ข์์ ์๋ฅผ "๋ณด์ผ ์ ์๊ฒ ํ๋" ๊ธฐ๋ฅ์ ์ํฅ์ ๋ฐ์ง ์๋ 2008๋ 9์ 22์ผ์ ํฌ์คํ ๋ song ๋ค์ ๊ธฐ์ค์ผ๋ก set ์ ๊ตฌ์ฑ
โ After_t
• Pre-treatment : T1 - 1 (for treated group) , T0 - 1 (for control group)
• Post-treatment : T1 + 1, T0 + 1
• ์ ์ ์ listening behavior ๊ฐ ๋ผ์น๋ ์ํฅ์ ๋ฐฐ์ ํ๊ธฐ ์ํด Short estimation window ๋ฅผ ์ค์ (± 1 day)
• DiD ์ ์ฉ ๊ธฐ์ค ์์ ์ด ๋ค๋ฅธ ๊ฒ์ด ํน์ง : T0, T1 ๐ Confounding ์ ๋ฐ์์ํฌ ์ ์๋ ์์
โข DiD Time separation ์ ํ ๊ฒ์ด ํฐ ์ฐ๋ ค์ง์ ์ด ์๋ ์ด์ โญ
• 1) Pre-treatment ๊ธฐ๊ฐ ๋์ ๊ฐ group ์์ ๊ฐ ์๊ฐ๋ ๋ณ ์ด ์ฒญ์ทจ ํ์๋ฅผ ๋น๊ตํ์ ๋, ๋น์ทํ ํจํด์ ๋ณด์
• 2) ๋ ธ๋๊ฐ Posting ๋๋ time ์ exogeneous ํ๋ค. The hype machine ์ ์ํด์ ๊ฒฐ์ ๋๋ ๊ฒ์ด ์๋๋ผ Original MP3 blog (์ฌ๋ฌ ์์ ๊ณผ ๊ด๋ จ๋ ๋ธ๋ก๊ทธ๋ค) ๋ค์ ํตํด posting ๋๋ค.
• 3) ์ฅ๋ฅด๋ ์ธ๊ธฐ๋ ๊ด์ ์์ ๊ฐ ๊ทธ๋ฃน์ song ๋ค์ ํน์ฑ์ด ๋น์ทํ๋ค. ๋ํ ๋ถ์์์ sample ๋ค ๊ฐ์ ์ ์ฌ์ฑ์ ๋์ด๊ธฐ ์ํด CEM ๋งค์นญ ๋ฐฉ๋ฒ์ ์ ์ฉํ๋ค.
• 4) DiD ์ ํ์์ ์ธ ๊ฐ์ ์ธ Common trend ๋ฅผ ๋ง์กฑํ๊ณ ์๋ค.
| Treatment and control groups have a common trend in the absence of treatment =assumption of a common pretreatment trend for the treatment and control samples
์์ ์ฒญ์ทจ ํ์๊ฐ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๊ฐ์ํ๋ ๊ฒฝํฅ์ ๋ณด์ด๋๋ฐ, ๋ ธ๋๋ง๋ค ํฌ์คํ ์๊ฐ์ด ๋ค๋ฅด๋ฏ๋ก, ์ฒ์น์ง๋จ๊ณผ ํต์ ์ง๋จ ๊ฐ pretreatment trend ๋ฅผ ๋น๊ตํ๊ธฐ ์ํด, posting ์ดํ์ ์ฒ์ 12์๊ฐ window ์ ๋๋ฒ์งธ 12์๊ฐ window ๊ฐ๊ฐ์ ํ๊ท ์ ์ธ ์ฒญ์ทจ ์์ ์ฐจ์ด (Difference of Listens) ๋ฅผ ์ฌ์ฉํ๋ค. (์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ฒญ์ทจ ์๋ ๊ฐ์ํ๋ ๊ฒฝํฅ์ ๋ณด์ด๋ฏ๋ก Difference of Listens ๊ฐ ๋๋ถ๋ถ ์์๊ฐ์ ๊ฐ์ง) ์ด๋ ๋ ๊ทธ๋ฃน ๊ฐ ๋ถํฌ๊ฐ ์ ์ฌํ๊ณ , t-test ๊ฒฐ๊ณผ๋ mean difference ๊ฐ insignificant ํ ๊ฒฐ๋ก ์ ๋ด๋ ธ๊ธฐ ๋๋ฌธ์ ๊ฐ์ ์ ๋ง์กฑํ๋ค๊ณ ๋ณผ ์ ์๋ค.
• 5) Robustness check : ๋ฐ์ดํฐ๋ฅผ ์์งํ ๊ธฐ์ค ์์ (9/29,22 ๋ง๊ณ ) ์ ๋ฌ๋ฆฌ ํ๋ฉด์ ๋ถ์์ ์งํํจ → Not sensitive to exactly when the songs are posted
โข Model specification
โช song j on day t : ๋ถ์ ๋จ์๋ Song level
โช t = {T0-1, T0+1, T1-1, T1+1}
โช PopTreatment_j : 1์ด๋ฉด treated group, 0์ด๋ฉด control group
โช After_t : 1์ด๋ฉด post-treatment, 0์ด๋ฉด pre-treatment period
โช β4 : PopTreatment_j X After_t : magnitude of popularity influence โญ
โต Proximity influence
โข ๊ธฐ๋ณธ ๊ฐ์
• Assumption: ์ฃผ๋ณ ์น๊ตฌ๊ฐ ํน์ song ์ ์ข์์๋ฅผ ๋๋ฅธ ํ๋์ด, ์ ์ ๊ฐ ํด๋น song ์ ๋ฃ๋ ๊ฒ์ ๋ฏธ์น๋ ์ํฅ : How favoriting a song by a focal user impacts the listening behavior of her social ties
• User-song ๋จ์ ๋ถ์
• Treatment group : ํด๋น ๋ ธ๋๋ฅผ ์ข์์ ๋๋ฅธ ์น๊ตฌ๊ฐ ์ ์ด๋ 1๋ช ์ด์ ์๋ ์ ์ ๋ค๋ก ๊ตฌ์ฑ
• Control group : ํด๋น ๋ ธ๋๋ฅผ ์ข์์ ๋๋ฅธ ์น๊ตฌ๊ฐ ๋จ ํ๋ช ๋ ์๋ ์ ์ ๋ค๋ก ๊ตฌ์ฑ
โข Propensity score matching
• Control for potential homophily
• ๋งค์นญ ๋จ์ : User ๋ฅผ ๊ธฐ์ค์ผ๋ก ๋งค์นญ (e.g. User A - User B)
• ๋งค์นญ ๋ชฉํ : Control group ์ ์ ์ ๋ค์ ์์ ์ทจํฅ, ์ ์ ์ ๋ํ ๊ด์ธก ๊ฐ๋ฅํ ํน์ง, ์น๊ตฌ ์๋ฅผ ๊ธฐ์ค์ผ๋ก Treatment group ์์ ๊ฐ์ฅ ์ ์ฌํ ์ ์ ์ ๋งค์นญ์ํค๋ ๊ฒ์ด ๋ชฉํ → ์ ์ ์ ๋ํ demographic ํ ์ ๋ณด๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ถ์ฒ ์์คํ ๊ณผ ๋น์ทํ๊ฒ song listening behavior ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋งค์นญ์ ์งํํจ
• ๋งค์นญ ๊ธฐ์ค : Relative song listening profiles of users (taste)
โช ์ ์ ์ ์ฒญ์ทจ ๊ธฐ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ฌ, 3์ฃผ ๊ธฐ๊ฐ๋์ ๊ฐ ์ ์ ์ ๋ํด profile ์ ์์ฑํ๋ ๊ฒ์ด ๋ชฉํ
โช ์ฝ 8๋ง๊ฐ์ ๋ ธ๋์ ๋ํด ์ฅ๋ฅด, ์ํฐ์คํธ ์ธ๊ธฐ๋ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ๋ค์ ์์งํด ๋ ธ๋์ ๋ํ ์ ๋ณด๋ฅผ ๋ณด์ํ๋ค.
โช ๊ฐ User-Song pair ์ ๋ํด, ์ ์ ๊ฐ ํน์ ๋ ธ๋๋ฅผ ๋ค์ ํ์๋ฅผ ๊ธฐ์ค์ผ๋ก ํ์ฌ ํด๋น ์ ์ ์ ๋ํ ์ ์ฒด ์ฒญ์ทจ ํ์์ ๋ฐฑ๋ถ์จ๋ก Weight ๋ฅผ ๊ณ์ฐํ์๋ค. ๊ทธ๋ฐ ๋ค์ ์ ์ ๊ฐ ์ฒญ์ทจํ ๋ชจ๋ ๋ ธ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก 28๊ฐ์ ๊ฐ์คํ๊ท ๋ ๋ ธ๋ ํน์ฑ์ ๋ฐ์ํ ํ๋์ ๋ฒกํฐ๋ก ๋ง๋ค์๋ค. ์ด ๊ฒฐ๊ณผ๋ฅผ ํตํด ์ ์ ์ Profile ์ ์ผ๋ จ์ ์ซ์ (๋ ธ๋ ํน์ฑ์ ๊ฐ์ค ํ๊ท )๋ก ์์ฝํ ์ ์์ผ๋ฉฐ, ๊ฐ ์ซ์๋ ํน์ ์์ ํน์ฑ์ ๋ํ ์ฌ์ฉ์์ ์ทจํฅ์ ๋ํ๋ธ๋ค.
โช ์์ฑ๋ Profile ์ PSM ์์ ๋ ๊ทธ๋ฃน์ ์ ์ ๋ฅผ ๋งค์นญ์ํค๊ธฐ ์ํด ์ฌ์ฉ๋๋ค.
โช ๋ ๊ทธ๋ฃน์ ์ํ ๊ฐ Song ์ ๋ํด์, ์ ์ ์ ์ฒญ์ทจ๊ธฐ๋ก, ์น๊ตฌ ์, ํน์ฑ์ ๋ฐ์ํ logit model ์ ๊ธฐ๋ฐ์ผ๋ก Treatment group ์ ์ํ ํ๋ฅ ์ ํ ๋นํ๋ค.
• Propensity score 0.1 ์ด๋ด์ ์๋ ๊ด์ธก์น๋ค์ ๊ธฐ์ค์ผ๋ก ๋งค์นญ (Caliper = 0.1)
• PSM ์ดํ์ ๊ฐ ๊ทธ๋ฃน์ Propensity score ๋ถํฌ๋ฅผ ๋ํ๋ด ์ ์ฌ๋๋ฅผ ํ์ธ
โป ๋ณด์ถฉ ์ค๋ช
• Ti : ์ฒ์น์ง๋จ์ ์๋ User : Song j ๋ฅผ ๋ค์ด๋ณธ ์ ์ ์์ง๋ง ํ๋ก์ํ ์น๊ตฌ๊ฐ ์ข์์๋ฅผ ๋๋ฅธ ๊ฒฝ์ฐ์ ์ํ ์ง๋จ์ User
• Ci : ํต์ ์ง๋จ์ ์๋ User : Ti ์ ์ ์ ์ ๋น์ทํ taste ๋ฅผ ๊ฐ์ง๊ณ (based on listen profile), song j ๋ฅผ ๋ค์ด๋ณธ ์ ์ด ์์ผ๋ฉฐ ํด๋น ๋ ธ๋์ ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ํ ๋ช ๋ ์๋ ๊ฒฝ์ฐ์ ์ํ ์ง๋จ์ user
0. 3์ฃผ ๊ธฐ๊ฐ๋์์ ์ ์ ์ listening behavior ๋ฅผ profile ํจ (28๊ฐ์ ์์ ํน์ฑ์ ํฌํจํ๋ vector ์ ํ๋ก์ ์๋ฅผ ๊ธฐ์ค์ผ๋ก)
1. Treatment group (T) ์ ์ ์ (Ti ์ค๋ช ์ฐธ๊ณ )
2. Potential control group PC ๋ฅผ ์ ์ : T ์ ์ํ์ง ์๋ user
3. Control group (C) ๋ฅผ ์ ์ํ๋ค. ์ ์ ์ taste profile ์ ๊ธฐ๋ฐํ์ฌ, treated ๋ฐ์ propensity ๋ฅผ ์์ธกํ๋ logit model ์ ํ์ฉํด, ์ฃผ์ด์ง song ์ ์ฒญ์ทจํ Propensity ๋ฅผ ๋งค์นญ (Matching the propensity of listening to any given song) ํ๋ค. T์ ์ํ ๊ฐ user Ti ๋ฅผ PC ์ ์ํ PCi ์ ์ ์ ๋งค์นญํ๊ณ , ๋งค์นญ๋ ์ ์ ๋ค์ group C ๋ก ์ ์ํ๋ค.
4. T์ C ์์ user-song observation ๋ค์ ๋ณต๊ตฌ (Recover) ํ๋ค. ๊ฐ song j ์ ๋ํด ๋ง์ฝ user Ti ๊ฐ song j ๋ฅผ ์ข์์ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋ค๋ฉด user-song j pair ๋ฅผ ์ฌ๊ตฌ์ฑํ๋ค. ์ดํ song j ์ ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋ user Ci ์ ๋งค์นญ์ ์งํํ๋ค.
โข Euclidean Distance Matching
• Robustness check ์ ์ํด ์ฌ์ฉ
• ๋งค์นญ ๋จ์ : User-song level → ๊ฐ song ์ ๋ํด > ๊ฐ user ๋ฅผ ๋งค์นญ : ์ ์ ๊ฐ ์ฃผ์ด์ง ๋ ธ๋๋ฅผ ์ฒญ์ทจํ likelihood ๋ฟ๋ง ์๋๋ผ ํด๋น ๋ ธ๋๋ฅผ ์ข์ํ๋ ์น๊ตฌ๋ฅผ ๊ฐ์ง likelihood (the likelihood of being treated) ๊น์ง ๊ณ ๋ คํ์ฌ ๋งค์นญ์ ์งํํ๋ค.
• ๋งค์นญ ๊ธฐ์ค : ํด๋น ๋ ธ๋๋ฅผ ๋ค์ด๋ณธ์ ์ ์์ผ๋ ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋ ์ ์ Ti ์, (Ti์ ๋น์ทํ ๋ ธ๋ ์ทจํฅ์ ๊ฐ์ง๊ณ , ํด๋น ๋ ธ๋๋ฅผ ๋ค์ด๋ณธ ์ ์ด ์๊ณ , ๊ทธ๋ฌ๋ ํด๋น ๋ ธ๋๋ฅผ ์ข์ํ ๊ฐ๋ฅ์ฑ์ด ๋์ (์์ง ์ข์์๋ฅผ ๋๋ฅธ ๊ฒ์ ์๋) ์น๊ตฌ๋ฅผ ๊ฐ์ง) ์ ์ Ci ์ ๋งค์นญ์ ์งํํ๋ค. 238 ๊ฐ์ treatment user-song pair ๊ฐ ์๋ค. ์ด์ฒ๋ผ user-song level ๋ก ๋ถ์ํ๋ฉด treated observation ๊ฐ์๊ฐ ๋งค์ฐ ์ ์ด์ง๋๋ฐ, ์ด๋ฐ ๊ฒฝ์ฐ ๋ก์ง์คํฑ ํ๊ท๋ถ์์ ์ ์ฉํ๊ฒ ๋๋ฉด ๋ค๋ฃจ๊ธฐ ์ด๋ ค์์ง๋ค. ์ด๋ฅผ ์ํ์ํค๊ธฐ ์ํด ๋งค์นญ ๊ณผ์ ์์ ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ค.
โป ๋ณด์ถฉ ์ค๋ช
0. PSM ๊ณผ์ ๊ณผ ๋์ผํ๊ฒ user ์ ์ฒญ์ทจํ๋์ ๋ํ Profile vector ๋ฅผ ์์ฑํ๊ณ
1. ๊ฐ song j ์ ๋ํด
โ 1-(a). Tj (treatment group) ์ ๊ฒฐ์ ํ๋ค : song j ๋ฅผ ๋ค์ด๋ณธ์ ์ ์์ง๋ง ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๊ฐ ์๋ ์ ์
โ 1-(b). PCj (potential control group) ์ ๊ฒฐ์ ํ๋ค : song j ๋ฅผ ๋ค์ด๋ณธ์ ์ด ์๊ณ , ํด๋น ๋ ธ๋์ ์ข์์๋ฅผ ๋๋ฅธ ์น๊ตฌ๋ ์๋ ์ ์
โ 1-(c). 0๋ฒ์งธ ๋จ๊ณ์์ ๊ตฌํ ๋ฒกํฐ ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก Tj ์ PCj ์ ์๋ ์ ์ ๋ค ๊ฐ์ ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ๋ค. Treatment group ์ ์ํ ๊ฐ ์ ์ ์ ๋ํด, ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ์ฅ ์งง์ PC group ์ ์ํ 3๋ช ์ candidate ์ ์ ๋ค์ ์ ํํ๋ค.
โ 1-(d). Cj ๋ฅผ ๊ฒฐ์ ํ๋ค : 1-c ์์ ์ ํ candidate user ๋ค์ ๊ฐ profile ๊ณผ song j ์ profile ์ ์ ํด๋ฆฌ๋์ ๊ฑฐ๋ฆฌ๋ฅผ ๋น๊ตํ์ฌ ๊ฐ์ฅ ์งง์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ฐ์ง๋ user ๋ฅผ ์ ํํ๋ค.
โ 1-(e). Recover user-song j pair for users in Tj, Cj
โข Probit model
• Examine the impact of proximity influence on the likelihood of listening to a song → implement a binary probit model (ํด๋น ๋ ธ๋๋ฅผ ๋ฃ๊ฒ ๋ ํ๋ฅ ์ ์์ธก)
• 9์ 22์ผ์ posting ๋ ๋ ธ๋๋ฅผ ๋์์ผ๋ก, ๋ ธ๋๊ฐ posting ๋ ์ดํ 48์๊ฐ ๋์ burn-in period ๋ฅผ allow ํ์ฌ favorites ๋ฅผ ์ป์ ์ ์๊ฒ ํจ. burn-in ๊ธฐ๊ฐ ์ดํ์ ์ ์ ์ listening choice ๋ฅผ 7์ผ๊ฐ following ํจ
• β1 : coefficient of interest on a focal user’s listen decision, captures the impact of proximity influence on a focal user’s listen decision
โข Hazard model (Weibull model)
• proximity influence by looking at the time to a user’s first listen to a song
• Hazard model ์ ์ฌ์ฉํ์ฌ user i ๊ฐ song j ๋ฅผ ์ฒ์์ผ๋ก ๋ฃ๊ธฐ ์ ๊ธฐ๊ฐ์ proximity influence ๊ฐ ๋ผ์น ์ํฅ์ ๋ํด ์ถ์
• hazard rate : λ_ij → defined by whether and when user i listened to song j
• β1 : coefficient of interest
โถ Combined
• ๋ ์ํฅ์ ๋์์ ๊ณ ๋ คํ DDD ๋ชจํ : popularity treatment + After_t + proximity influence treatment
• Song j ๋ DD ๋ถ์๊ณผ ๋์ผํ๊ฒ data set ์ ์ค์
• ์ดํ PSM ์ ํตํด ๋ Proximity group ์ ์ํ ์ ์ ๋ค์ ๋งค์นญํจ
• Listen_gjt : total number of listens of proximity treatment type g of song j at time t , where t = {T0-1, T0+1, T1-1, T1+1} โ song j ์ ์ด ์ฒญ์ทจํ์
• After_t : pretreatment or posttreatment for popularity
• β3 : represents the magnitude of proximity influence
• β5 : represents the magnitude of popularity impact
• β7 : three-way interaction term : nature of interaction between popularity and proximity influence (β7 > 0 : complementary, β7 < 0 : substitute)
โค Results
โฏ Popularity influence
โข ํด์
• (Matching ํ) N ์ ์ฃผ๋ชฉํ๊ธฐ
• PopTreatment x After : captures the average effect of the treatment on the number of listens after the availability of song popularity information on the website (๋ ธ๋ ์ธ๊ธฐ ์ ๋ณด ๊ณต๊ฐ์ ์ฌ์ฉ์ ์ฒญ์ทจ ํ์ ์ฌ์ด์ ์ธ๊ณผ๊ด๊ณ)
• After feature implementation, increases the total listens of average song by 19.6% (exp(0.18)) in model2
• magnitude and significance are highest in model 3 and 4 = Popularity influence is strongest for isolates (users with no friends) and for the first listen of a song (↔ repeat listens)
โข Robustness check
• Validating DD research design with the treatment and control samples drawn from neighboring weeks
• ํน์ ํ ์์ผ์ ์ ํํ๊ธฐ ๋๋ฌธ์ ๋ํ๋ ๊ฒฐ๊ณผ๊ฐ ์๋์ (for generalize) ๋ฐํ๊ธฐ ์ํด ๋ค๋ฅธ ๋์์ ์ธ ์์ธ๋ค์ ์ ํํด์ ๋ชจ๋ธ๋ง์ ์งํ ⇒ Robust and there no “secular” effects in different weeks
โข Narrow-appeal music VS broad appeal music
• ์๋ง์กด ์๋ฐ ํ๋งค ์์ ๋ฐ ์ฃผ๋ฅ/๋น์ฃผ๋ฅ ์ฅ๋ฅด๋ฅผ ๊ธฐ์ค์ผ๋ก Song group ์ ๊ตฌ๋ถ
• ์ธ ๋ชจ๋ธ์์ ๋ชจ๋ interaction term ์ ๊ณ์์์ positive in sign, but significant only for narrow appeal song samples
โฏ Proximity influence
• ProxTreatment → probit, hazard ๋ชจ๋ธ์์ ๋ชจ๋ positive & significant ํ๊ณ , random matching ๋ณด๋ค PSM or EDM ์ผ ๋ magnitude of coefficient ๊ฐ goes down ํจ (to be able to isolate it from homophily)
โฏ Combined model of Popularity and Proximity influence
• user-song granularity : Listen_gjt ⇒ g : user proximity group, j : song, time t
๐ค ๋ ผ๋ฌธ์์ dependent variable ์ log(Listen_git) ๋ก ์ค์ ํ๊ณ , Treatment ์ Control group ์ PSM ๋งค์นญํ๋ ๊ณผ์ ์ ๋ํด ์ถ๊ฐ์ ์ธ ์ค๋ช ์ด ์์ (Supplement ์๋ฃ๋ ์์)
• Model1. Populairty influence
โช PopTreatment x After
โ Full sample ์ผ ๋ not significant โจ due to sparseness of total listens at the user-song granularity : User-song ๋จ์๋ก matching ๋ ๋ฐ์ดํฐ์ ์ผ๋ก ์งํ๋์๊ธฐ ๋๋ฌธ (N=160) โจ g index (๊ธฐ๊ฐ T0, T1 ์ ์ํ๋ Song j ์ ๋ํด, Proximity ์กฐ๊ฑด์ ๋ง๋ user ๋ค์ ์ถ๋ฆฌ๋ค ๋ณด๋ N์ ๊ฐ์๊ฐ ๋งค์ฐ ์ค์ด๋ฆ)
โ subsample analysis ์์ ProxTreatment = 0 ์ผ ๋๋ง (=user does not have a friend who has previously favorited the song) PSM ์์ ๊ณ์๊ฐ significant ํจ ⇒ substitutes ๊ด๊ณ
• Model2. Proximity influence
โช PopTreatment_gj
โ full model → positive and significant & magnitude declines under PSM
โ subsample analysis ์์ PopTreatment ๊ฐ 0์ผ ๋ (absence ํ ๋) ProxTreatment ๋ณ์๊ฐ greater sign and significance ํ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค ⇒ substitutes ๊ด๊ณ
• Model3. Popularity & Proximity influence
โช PopTreatment_j x After_t x ProxTreatment_gj
โ coefficient is negative and significant → popularity and proximity influence are substitutes
โ specifically, popularity influence is less important in the presence of proximity influence
โฅ Conclusion
๋๊ธ