[求助]主成分分析前为什么要进行原始数据的标准化
主成分分析前为什么要进行原始数据的标准化
这二天看到主成分分析的一个程序 前面部分如下:
stdr=std(dataset); %求个变量的标准差
[n,m]=size(dataset); %定义矩阵行列数
sddata=dataset./stdr(ones(n,1),: ); %将原始数据采集标准化
sddata %输出标准化数据
有个问题就是为什么要进行原始数据的标准化?是否一定要进行?有没有标准规定是否标准化,如方差、标准差在多少范围内之类?
我用标准化的数据更原始数据分别处理,得到的二维图明显不同。请高手不吝指教,谢谢。