데이터$X \in \mathbb{R}^{n \times d}$ (row: sample, column: feature)가 평균 0이고, normalized (zero-centered) 되었다고 가정합니다.
PCA는 다음을 만족하는 벡터 $\mathbf{w} \in \mathbb{R}^d$ (단위 벡터)를 찾는 문제입니다:
$max_{∥w∥=1}Var(Xw)$
즉, 데이터를 w\mathbf{w}w 방향으로 투영했을 때 분산을 최대화하는 $\mathbf{w}$를 찾는 문제입니다