Beyond Myopia: Learning from Positive and Unlabeled data through predictive Trends

解説スライドメインに読み適宜論文から補足していく。

手法 #

Positive Negative Learningは損失関数としては以下のように定義。

$$ \pi = p(y = +1) \\ \hat{R} _{PN}(g) = \pi R _{P} ^ + (g) + (1 - \pi) \hat{R} _{N} ^ - (g) $$

$R _{P} ^ + (g) = \frac{1}{n _{+}} \sum _{\mathbf{x} _i \in X _+ } l(g(\mathbf{x} _i), +1)$ positiveの分類誤差の不偏推定量。
$R _{P} ^ + (g) = \frac{1}{n _{-}} \sum _{\mathbf{x} _i \in X _- } l(g(\mathbf{x} _i), -1)$ negativeの分類誤差の不偏推定量。

DuPlessisら？が考えたUnlabeledは、$\pi$だけの割合のpositiveが混ざり、$1 - \pi$だけの割合のnegativeが混ざるというもの。