PSM-理论
发布网友
发布时间:2024-10-14 09:17
我来回答
共1个回答
热心网友
时间:2024-10-14 12:10
当我们工作中遇到归因分析难题,而无法单纯依赖ABtest时,例如新策略的用户留存高,问题在于确定策略的真正影响及其具体效果。难点在于样本选择带来的内生性问题,即模型中的解释变量与随机扰动项关联,可能导致因果推断的偏差。
内生性问题是指模型中解释变量与未观测到的干扰因素相互影响,如使用最小二乘法模型分析时,如果这种干扰影响了“因”与“果”,结果就不准确。解决内生性问题的方法包括工具变量法、匹配法、双重差分法等,其中,PSM倾向得分匹配法在解决选择性偏误上特别实用。
选择性偏误主要源于解释变量选择的非随机性,如参加培训与找工作例子中的自选择偏误,因为能力因素可能导致参加者与未参加者结果偏差。样本选择偏误则源于样本非随机选取,如高铁采访中漏掉未购票乘客的数据。倾向性匹配通过匹配相似特征的个体,如培训例子中匹配学历和年龄,以减小样本差异导致的偏误。
然而,PSM的成功依赖于两个关键假设:条件独立假设,即处理组和控制组在实验前无差异;共同支撑假设,即处理组个体在理想情况下能在控制组中找到类似个体。如果这些假设不成立,PSM的效果可能受限。总的来说,PSM是一种通过模拟处理组特征的预测,为控制组个体找到最匹配样本的统计方法,以解决归因分析中的复杂问题。