clearScreenZJ
diff --git a/‎PCA/data1.mat
-995 Bytes b/‎PCA/data1.mat
-995 Bytes
diff --git a/‎formula/PCA.wmf
1.77 KB b/‎formula/PCA.wmf
1.77 KB
diff --git a/‎images/PCA_01.png
20.8 KB b/‎images/PCA_01.png
20.8 KB
diff --git a/‎images/PCA_02.png
6.98 KB b/‎images/PCA_02.png
6.98 KB
diff --git a/‎images/PCA_03.png
15.7 KB b/‎images/PCA_03.png
15.7 KB
diff --git a/‎images/PCA_04.png
15.9 KB b/‎images/PCA_04.png
15.9 KB
diff --git a/‎images/PCA_05.png
29.7 KB b/‎images/PCA_05.png
29.7 KB
diff --git a/‎images/PCA_06.png
164 KB b/‎images/PCA_06.png
164 KB
diff --git a/‎images/PCA_07.png
121 KB b/‎images/PCA_07.png
121 KB
diff --git a/‎images/PCA_08.png
266 KB b/‎images/PCA_08.png
266 KB
diff --git a/‎readme.md
Lines changed: 121 additions & 2 deletions b/‎readme.md
Lines changed: 121 additions & 2 deletions
@@ -870,7 +870,118 @@ def runKMeans(X,initial_centroids,max_iters,plot_process):
 
 ----------------------
 
-六、PCA主成分分析（降维）
+## 六、PCA主成分分析（降维）
+- [全部代码](/PCA/PCA.py)
+### 1、用处
+- 数据压缩（Data Compression）,使程序运行更快
+- 可视化数据，例如`3D-->2D`等
+- ......
+
+### 2、2D-->1D，nD-->kD
+- 如下图所示，所有数据点可以投影到一条直线，是**投影距离的平方和**（投影误差）最小
+![enter description here][41]
+- 注意数据需要`归一化`处理
+- 思路是找`1`个`向量u`,所有数据投影到上面使投影距离最小
+- 那么`nD-->kD`就是找`k`个向量![$${u^{(1)}},{u^{(2)}} \ldots {u^{(k)}}$$](http://latex.codecogs.com/gif.latex?%24%24%7Bu%5E%7B%281%29%7D%7D%2C%7Bu%5E%7B%282%29%7D%7D%20%5Cldots%20%7Bu%5E%7B%28k%29%7D%7D%24%24)，所有数据投影到上面使投影误差最小
+ - eg:3D-->2D,2个向量![$${u^{(1)}},{u^{(2)}}$$](http://latex.codecogs.com/gif.latex?%24%24%7Bu%5E%7B%281%29%7D%7D%2C%7Bu%5E%7B%282%29%7D%7D%24%24)就代表一个平面了，所有点投影到这个平面的投影误差最小即可
+
+### 3、主成分分析PCA与线性回归的区别
+- 线性回归是找`x`与`y`的关系，然后用于预测`y`
+- `PCA`是找一个投影面，最小化data到这个投影面的投影误差
+
+### 4、PCA降维过程
+- 数据预处理（均值归一化）
+ - 公式：![$${\rm{x}}_j^{(i)} = {{{\rm{x}}_j^{(i)} - {u_j}} \over {{s_j}}}$$](http://latex.codecogs.com/gif.latex?%24%24%7B%5Crm%7Bx%7D%7D_j%5E%7B%28i%29%7D%20%3D%20%7B%7B%7B%5Crm%7Bx%7D%7D_j%5E%7B%28i%29%7D%20-%20%7Bu_j%7D%7D%20%5Cover%20%7B%7Bs_j%7D%7D%7D%24%24)
+ - 就是减去对应feature的均值，然后除以对应特征的标准差（也可以是最大值-最小值）
+ - 实现代码：
+ ```
+     # 归一化数据
+    def featureNormalize(X):
+        '''（每一个数据-当前列的均值）/当前列的标准差'''
+        n = X.shape[1]
+        mu = np.zeros((1,n));
+        sigma = np.zeros((1,n))
+        
+        mu = np.mean(X,axis=0)
+        sigma = np.std(X,axis=0)
+        for i in range(n):
+            X[:,i] = (X[:,i]-mu[i])/sigma[i]
+        return X,mu,sigma
+ ```
+- 计算`协方差矩阵Σ`（Covariance Matrix）：![$$\Sigma  = {1 \over m}\sum\limits_{i = 1}^n {{x^{(i)}}{{({x^{(i)}})}^T}} $$](http://latex.codecogs.com/gif.latex?%24%24%5CSigma%20%3D%20%7B1%20%5Cover%20m%7D%5Csum%5Climits_%7Bi%20%3D%201%7D%5En%20%7B%7Bx%5E%7B%28i%29%7D%7D%7B%7B%28%7Bx%5E%7B%28i%29%7D%7D%29%7D%5ET%7D%7D%20%24%24)
+ - 注意这里的`Σ`和求和符号不同
+ - 协方差矩阵`对称正定`（不理解正定的看看线代）
+ - 大小为`nxn`,`n`为`feature`的维度
+ - 实现代码：
+ ```
+ Sigma = np.dot(np.transpose(X_norm),X_norm)/m  # 求Sigma
+ ```
+- 计算`Σ`的特征值和特征向量
+ - 可以是用`svd`奇异值分解函数：`U,S,V = svd(Σ)`
+ - 返回的是与`Σ`同样大小的对角阵`S`（由`Σ`的特征值组成）[**注意**：`matlab`中函数返回的是对角阵，在`python`中返回的是一个向量，节省空间]
+ - 还有两个**酉矩阵**U和V，且![$$\Sigma  = US{V^T}$$](http://latex.codecogs.com/gif.latex?%24%24%5CSigma%20%3D%20US%7BV%5ET%7D%24%24)
+ - ![enter description here][42]
+ - **注意**：`svd`函数求出的`S`是按特征值降序排列的，若不是使用`svd`,需要按**特征值**大小重新排列`U`
+- 降维
+ - 选取`U`中的前`K`列（假设要降为`K`维）
+ - ![enter description here][43]
+ - `Z`就是对应降维之后的数据
+ - 实现代码：
+ ```
+     # 映射数据
+    def projectData(X_norm,U,K):
+        Z = np.zeros((X_norm.shape[0],K))
+        
+        U_reduce = U[:,0:K]          # 取前K个
+        Z = np.dot(X_norm,U_reduce) 
+        return Z
+ ```
+- 过程总结：
+ - `Sigma = X'*X/m`
+ - `U,S,V = svd(Sigma)`
+ - `Ureduce = U[:,0:k]`
+ - `Z = Ureduce'*x`
+
+### 5、数据恢复
+ - 因为：![$${Z^{(i)}} = U_{reduce}^T*{X^{(i)}}$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7BZ%5E%7B%28i%29%7D%7D%20%3D%20U_%7Breduce%7D%5ET*%7BX%5E%7B%28i%29%7D%7D%24%24)
+ - 所以：![$${X_{approx}} = {(U_{reduce}^T)^{ - 1}}Z$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7BX_%7Bapprox%7D%7D%20%3D%20%7B%28U_%7Breduce%7D%5ET%29%5E%7B%20-%201%7D%7DZ%24%24)     （注意这里是X的近似值）
+ - 又因为`Ureduce`为正定矩阵，【正定矩阵满足：![$$A{A^T} = {A^T}A = E$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24A%7BA%5ET%7D%20%3D%20%7BA%5ET%7DA%20%3D%20E%24%24)，所以：![$${A^{ - 1}} = {A^T}$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7BA%5E%7B%20-%201%7D%7D%20%3D%20%7BA%5ET%7D%24%24)】，所以这里：
+ - ![$${X_{approx}} = {(U_{reduce}^{ - 1})^{ - 1}}Z = {U_{reduce}}Z$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7BX_%7Bapprox%7D%7D%20%3D%20%7B%28U_%7Breduce%7D%5E%7B%20-%201%7D%29%5E%7B%20-%201%7D%7DZ%20%3D%20%7BU_%7Breduce%7D%7DZ%24%24)
+ - 实现代码：
+ ```
+    # 恢复数据
+    def recoverData(Z,U,K):
+        X_rec = np.zeros((Z.shape[0],U.shape[0]))
+        U_recude = U[:,0:K]
+        X_rec = np.dot(Z,np.transpose(U_recude))  # 还原数据（近似）
+        return X_rec
+ ```
+
+### 6、主成分个数的选择（即要降的维度）
+- 如何选择
+ - **投影误差**（project error）：![$${1 \over m}\sum\limits_{i = 1}^m {||{x^{(i)}} - x_{approx}^{(i)}|{|^2}} $$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7B1%20%5Cover%20m%7D%5Csum%5Climits_%7Bi%20%3D%201%7D%5Em%20%7B%7C%7C%7Bx%5E%7B%28i%29%7D%7D%20-%20x_%7Bapprox%7D%5E%7B%28i%29%7D%7C%7B%7C%5E2%7D%7D%20%24%24)
+ - **总变差**（total variation）:![$${1 \over m}\sum\limits_{i = 1}^m {||{x^{(i)}}|{|^2}} $$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7B1%20%5Cover%20m%7D%5Csum%5Climits_%7Bi%20%3D%201%7D%5Em%20%7B%7C%7C%7Bx%5E%7B%28i%29%7D%7D%7C%7B%7C%5E2%7D%7D%20%24%24)
+ - 若**误差率**（error ratio）：![$${{{1 \over m}\sum\limits_{i = 1}^m {||{x^{(i)}} - x_{approx}^{(i)}|{|^2}} } \over {{1 \over m}\sum\limits_{i = 1}^m {||{x^{(i)}}|{|^2}} }} \le 0.01$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24%7B%7B%7B1%20%5Cover%20m%7D%5Csum%5Climits_%7Bi%20%3D%201%7D%5Em%20%7B%7C%7C%7Bx%5E%7B%28i%29%7D%7D%20-%20x_%7Bapprox%7D%5E%7B%28i%29%7D%7C%7B%7C%5E2%7D%7D%20%7D%20%5Cover%20%7B%7B1%20%5Cover%20m%7D%5Csum%5Climits_%7Bi%20%3D%201%7D%5Em%20%7B%7C%7C%7Bx%5E%7B%28i%29%7D%7D%7C%7B%7C%5E2%7D%7D%20%7D%7D%20%5Cle%200.01%24%24)，则称`99%`保留差异性
+ - 误差率一般取`1%，5%，10%`等
+- 如何实现
+ - 若是一个个试的话代价太大
+ - 之前`U,S,V = svd(Sigma)`,我们得到了`S`，这里误差率error ratio:    
+ ![$$error{\kern 1pt} \;ratio = 1 - {{\sum\limits_{i = 1}^k {{S_{ii}}} } \over {\sum\limits_{i = 1}^n {{S_{ii}}} }} \le threshold$$](http://latex.codecogs.com/gif.latex?%5Cfn_cm%20%24%24error%7B%5Ckern%201pt%7D%20%5C%3Bratio%20%3D%201%20-%20%7B%7B%5Csum%5Climits_%7Bi%20%3D%201%7D%5Ek%20%7B%7BS_%7Bii%7D%7D%7D%20%7D%20%5Cover%20%7B%5Csum%5Climits_%7Bi%20%3D%201%7D%5En%20%7B%7BS_%7Bii%7D%7D%7D%20%7D%7D%20%5Cle%20threshold%24%24)
+ - 可以一点点增加`K`尝试。
+
+### 7、运行结果
+- 2维数据降为1维
+ - 要投影的方向     
+![enter description here][44]
+ - 2D降为1D及对应关系        
+![enter description here][45]
+- 人脸数据降维
+ - 原始数据         
+ ![enter description here][46]
+ - 可视化部分`U`矩阵信息    
+ ![enter description here][47]
+ - 恢复数据    
+ ![enter description here][48]
 
 
   [1]: ./images/LinearRegression_01.png "LinearRegression_01.png"
@@ -912,4 +1023,12 @@ def runKMeans(X,initial_centroids,max_iters,plot_process):
   [37]: ./images/K-Means_07.png "K-Means_07.png"
   [38]: ./images/K-Means_04.png "K-Means_04.png"
   [39]: ./images/K-Means_05.png "K-Means_05.png"
-  [40]: ./images/K-Means_06.png "K-Means_06.png"
+  [40]: ./images/K-Means_06.png "K-Means_06.png"
+  [41]: ./images/PCA_01.png "PCA_01.png"
+  [42]: ./images/PCA_02.png "PCA_02.png"
+  [43]: ./images/PCA_03.png "PCA_03.png"
+  [44]: ./images/PCA_04.png "PCA_04.png"
+  [45]: ./images/PCA_05.png "PCA_05.png"
+  [46]: ./images/PCA_06.png "PCA_06.png"
+  [47]: ./images/PCA_07.png "PCA_07.png"
+  [48]: ./images/PCA_08.png "PCA_08.png"