Beyond Myopia: Learning from Positive and Unlabeled data through predictive Trends
解説スライドメインに読み適宜論文から補足していく。
手法 #
Positive Negative Learningは損失関数としては以下のように定義。
$$ \pi = p(y = +1) \\ \hat{R} _{PN}(g) = \pi R _{P} ^ + (g) + (1 - \pi) \hat{R} _{N} ^ - (g) $$
- $R _{P} ^ + (g) = \frac{1}{n _{+}} \sum _{\mathbf{x} _i \in X _+ } l(g(\mathbf{x} _i), +1)$ positiveの分類誤差の不偏推定量。
- $R _{P} ^ + (g) = \frac{1}{n _{-}} \sum _{\mathbf{x} _i \in X _- } l(g(\mathbf{x} _i), -1)$ negativeの分類誤差の不偏推定量。
DuPlessisら?が考えたUnlabeledは、$\pi$だけの割合のpositiveが混ざり、$1 - \pi$だけの割合のnegativeが混ざるというもの。