當前位置：首頁 > 科技 > 正文

你要的PCA分析來啦！

啟示号
科技
3年前
448

主成分分析（Principal Component Analysis,PCA）是一種無監督的多元統計分析方法，能從總體上反應各組樣本之間的總體差異和組内樣本之間的變異度大小，其結果一目了然，在許多生信分析中可以運用到。

基本原理是，利用數學的方法，将原來變量重新組合成新的互相無關的幾個綜合變量（即主成分），對所有因素按重要性排序，通常靠後的微小因素被忽略掉，從而起到簡化數據的作用。實際項目中，我們可以通過PCA找出離群樣品、判别相似性高的樣品簇等。

PCA 是一種較為常用的降維技術，PCA 的思想是将維特征映射到維上，這維是全新的正交特征。這維特征稱為主元，是重新構造出來的維特征。

在 PCA 中，數據從原來的坐标系轉換到新的坐标系下，新的坐标系的選擇與數據本身是密切相關的。其中，第一個新坐标軸選擇的是原始數據中方差最大的方向，第二個新坐标軸選取的是與第一個坐标軸正交且具有最大方差的方向，依次類推，我們可以取到這樣的幾個坐标軸。

PCA的計算過程

1、去平均值，即每一位特征減去各自的平均值

2、計算協方差矩陣

3、計算協方差矩陣的特征值與特征向量

4、對特征值從大到小排序

5、保留最大的個特征向量

6、将數據轉換到個特征向量構建的新空間中

PCA分析有很多的方法可以實現，今天要講的是使用R來做PCA分析。在R中有兩個自帶的函數可以做PCA分析，分别是prcomp和princomp，這兩者之間的不同之處在于princomp隻能用于R mode，而prcomp對于R mode和Q mode都可以使用；

R mode是變量（variable）比數據（observation）多的類型，即列比行多，是基于variable的分析，Q mode則是基于observation的分析；兩者使用的算法也不同。所以對于不同的數據類型可以選擇相應的方法去分析。

PCA作圖方法介紹

> data <-read.table('text.xls',header=true)>

> pca = prcomp(data,scale=T)

> head(pca$x) #用于作圖的數據

> summary(pca) #PCA的統計信息

Standard deviation #标準差

Proportion of Variance #差異比例

Cumulative Proportion #累計比例

累計比例達0.8的主成分作為後續分析的數據，從碎石圖也可以判别；

>screeplot(pca,type = 'lines')

圖1：PCA碎石圖

圖上可以看出，從第四個主成分之後，曲線開始趨于平緩，所以選擇前四個主成分用于分析。

運用R自帶的基礎畫圖函數畫PCA散點圖
> group <- factor(c(rep('a',59),rep('b',71),rep('c',48)))="">
> colour_group <>
> colour <>
> plot(pca$x[,1:2],col =colour,pch=c(20,21,22,23,24)[group])
> legend('topleft',legend =levels(group),col=colour_group,pch =c(20,21,22,23,24))
> title('PCA')

圖2：PCA散點圖

用ggplot2畫PCA散點圖
>library(ggplot2)
> group_2 <>
> pca_result <>
> pca_result <->
>p<>
>p<>
> p

圖3：PCA散點圖

scatterplot3d畫PCA 3D圖
> library(scatterplot3d)
> par(mar=c(5.1,4.1,4.1,8.1),xpd=TRUE)
>scatterplot3d(pca_result[,1:3],pch=20,color=colour,angle=45,main='PCA_3D',cex.symbols=2,mar=c(5.1,4.1,4.1,8.1))
>legend('rigth',legend=group,col=colour,pch=20,bg='white',xpd=TRUE,inset=-0.5)

圖4：PCA 3D圖

ggfortify畫PCA圈圖
> library(ggfortify)
> data_2=cbind(data,group_2)
>autoplot(pca,data=data_2,colour='group',label=FALSE,frame=TRUE,frame.type='norm')

圖5：PCA圈圖

你可能想看：

你要的PCA分析來啦！

R mode是變量（variable）比數據（observation）多的類型;是基于variable的分析;PCA作圖方法介紹;-read.table('text.xls';header=true)...

SPC中的p、np、u、c圖的區别

用于控制對象為不合格品率或合格率等計數值質量指标的場合。那麼要檢測出過程失控就需要越大的分組樣本，它繪制的是每個分組樣本中的不合格品數，每個分組樣本必須有相同的樣本量或者各個樣本量足夠相似可以看作相等...

圍觀！3款适合鐵杆遊戲玩家的PC遊戲手柄推薦：舒服，無延時，香

遊戲控制器，以便您可以在舒适的沙發上玩PC遊戲？此列表中的每款都經過了我的徹底測試，以衡量您在玩遊戲的時候最注意的事情。請相信我，通過定制的遊戲手柄，可以快速輕松地創建特定于您的遊戲風格習慣。對于更喜...

SPC中的p、np、u、c圖的區别

圍觀！3款适合鐵杆遊戲玩家的PC遊戲手柄推薦：舒服，無延時，香

中國數字PCR領域最大融資出爐，新羿生物數字PCR産品已獲國家醫療器械上市許可

融資金額将用于新羿生物數字 PCR 平台的進一步發展，相關産品的臨床應用及商業化布局，同時推動分子診斷試劑盒等的研發。數字 PCR（dPCR）也是對核酸進行定量的一種技術，是對起始樣品的一種絕對定量。...

《上古卷軸5》NPC美顔Mod發布女性NPC更加美麗了

《上古卷軸5》NPC美顔Mod發布女性NPC更加美麗了：近日Mod作者ace發布了《上古卷軸5，天際重制版》高清美顔Mod。大幅提升原版NPC質量，本Mod包含高精度頭部建模。重制了NPC頭發和胡須...

中國數字PCR領域最大融資出爐，新羿生物數字PCR産品已獲國家醫療器械上市許可

《上古卷軸5》NPC美顔Mod發布女性NPC更加美麗了

【綜合篇】統計工具中敏感度分析指标解析 - 單因子方差分析，完全嵌套方差分析，回歸分析，實驗設計，測...

1月17日《》簡單解釋了蒙特卡羅分析中用到的五個指标（Palisade公司出品的@risk軟件中的敏感度分析指标），發現敏感度分析指标沒那麼簡單，敏感度分析指标在統計工具中的分布情況見篇首圖片。接下來...

【綜合篇】統計工具中敏感度分析指标解析 - 單因子方差分析，完全嵌套方差分析，回歸分析，實驗設計，測...

我們為什麼要理财？理财有什麼用？你要的答案都在這兒！

你真的知道理财是為了什麼嗎？我們投資理财不僅僅是為了賺錢，更不能把理财當發财的工具。可到最後的結果就是沒有識别理财的能力，我們可以清楚的發現他們缺乏風險意識、成本控制、理财規劃等基本的理财技能，所以理...

你要的安全感，我給不了

所以才想要安全感，我們要得真是安全感嗎，其實我們要的不是安全感，我們便沒有了安全感。其實我們是害怕孤獨。害怕失去和周圍事物的聯系。沒有安全感，你想要找個人跟你吃飯。此刻便一下沒了存在感，我們便會沒有存...

速看！你要的圖表教程來了（含全套125個圖表模闆）

VIP學員要制作一個堆積柱形圖+折線圖的組合圖。于是我第一時間想到了同花順上面關于淨利潤的圖表，平常我做圖表比較喜歡模拟各種App上面的效果圖，做圖表有一大堆細節。這樣做圖表的時候就會分成兩行。插入推...

别找了，你要的Excel求和問題妙解都在這裡了

Excel中最牛的查找函數是VLOOKUP、LOOKUP，1.計算文本表達式的和在統計數據的時候忘記輸入=号，宏表函數是早期低版本Excel中使用的。對以文字表示的一個公式或表達式求值，2.對帶顔色的...

逆向思維：人生當中真正重要的事情，就是你要找回自己

心盲卻讓你看不到自己人生的方向。不知道自己真正喜歡什麼，不知道自己到底想要什麼？購買各種自己根本就不需要的商品。每當看到别人擁有的東西，也要拼命工作賺錢，突然有一天成為了網紅打卡地，自己想變得萬衆矚目...

你要的Word、Excel、PPT高效辦公快捷鍵速查表來了！

先放一個跟技能無關的思考題，時不時有讀者私聊盧子要快捷鍵大全。按住Ctrl鍵下拉可生成序号，2.選擇區域，輸入盧子，按Ctrl+Enter組合鍵。即可在區域錄入相同的内容；3.按Ctrl+，組合鍵可以...

沒短闆是你要的直屏旗艦！骁龍8G2+獨顯加持，榮耀90GT測評體驗

榮耀直屏旗艦來了！前陣子，榮耀的90GT系列手機終于也出來了，這次的配置相對上一代，更強了，處理器了升級為了第二代骁龍8移動平台，而且有24GB内存+1TB存儲的頂配的組合，并繼續延續了獨顯芯片還增加...

我們為什麼要理财？理财有什麼用？你要的答案都在這兒！

你要的安全感，我給不了

PCA '數據 pca 圖

上一篇
徐偉剛《八字實例詳解》第一章

下一篇
觀世音菩薩三十三種化身像【圖】

你要的PCA分析來啦！

有話要說...取消回複

最新文章

揭秘：傷寒汗出病解的方式有哪些

洗髓修煉中的：找病、攻病、翻病、愈病！

（原創）顫證的經方治療案。。。

中醫教你：看指甲上的月牙診病

中藥方論（24）

僅一味中藥就可以降血糖，一味中藥的單藥方！

解郁安神顆粒：抑郁症、焦慮症都是因為肝的疏洩功能出現了失調

有一種痛苦叫牙疼，有種止疼藥叫艾灸！收藏起來，以備不時之需！

熱門文章

請你欣賞宋代名畫------晴春蝶戲圖

西藏和青海是如何納入中國版圖的來看吐蕃瓦解後千年曆史演變

古玉圖譜 – 書格

如何區分低位聚集與高位聚集

北宋這些縣到了金朝，為何出現治所大搬家的情況，發生了什麼事

RSI選股方法

黑神話悟空：看懂金蟬子為啥被貶，才明白黃眉為什麼要禍亂人間

炒股秘籍，實圖講解MACD指标，零軸金叉技巧選出買點！