x-learnerってなにかわからないからメモだけ取ってみた

因果推論と機械学習

 
機械学習と因果推論はなにをしているのか
・結果と傾向スコアを機械学習によって推定してから、その推定値を使用してさらに
 機械学習のよって処置効果を推定する(meta learning)
 
・ランダムフォレストを使用し、傾向スコアを推定することなしに処置効果を推定する
 
 
 meta learn について
CATE(conditinal average treatment effect)を推定する
→平均処置効果をある条件に限定して算出したもの
 
 ate := E[Y(1) - Y(0)]
 
cate はm(0)とm(1)の差分がcate  となる
 
ある条件下で、施作を実施した場合はその結果を確認することができるが、
同一の条件下で、施作を実施しなかった場合の結果は確認できない
 
 
結果が確認できなかった方を機械学習で推定しようと考える
 
 
方法は大きく分けて2段階に分かれる
 
・処置あり/処置なしのそれぞれの効果を推定する
方法
・tree modelによる手法
・線形回帰による手法
 
処置を行った場合の効果と行わなかった場合の効果を推定し、その差分を推定効果とする
 
木モデルを使った場合
→ T-learner
 
線形回帰を使った場合
→S-learner
 
 
 
2段階目
・結果変数の正解データと推定した因果効果の差分も活用
・傾向スコア等での重みづけ
 
を使用して精度を高めるのが X-Learner
 
 
重み関数
実測値に近づけるために最適な重み関数を設定する
重み関数=傾向スコアとなる
(ランダムフォレスト等で推定して、共変量のバランスを調整している
 
cateを推定するために
X-Learnerが良い点
・CATEがスパースの場合でも対応しやすく、CATEの滑らかさを(微分可能性)にも対応しやすい
・データ中の処置・対照に大きな偏りがある場合にもある程度対応可能
(対照群のデータは集めやすく、処置群のデータは少ない)
 
 
Uplift Modeling の手法を用いて、どの顧客にどんなチャネルでどのような
キャンペーンを打てば、コストパフォーマンスが良いかを検証する
 
uplift modeling 
介入による効果の最大化を目的としたモデル化の手法
 
 
XーLearner 、R-Learner を改善したモデルをAUCC(Area under the uplift cover