當前位置:首頁 > 健康養生 > 正文

微生物多樣研究—β多樣性分析概述

一、β-多樣性分析介紹

1. β(Beta)Diversity:

是對不同樣品/不同組間樣品的微生物群落構成進行比較分析。

  • β多樣性分析前的數據“來源”:

1)OTUs的豐度信息表;

2)OTUs之間的系統發生關系,

計算UnweightedUnifrac及Weighted Unifrac距離。

  • 通過多變量統計學方法主成分分析(PCA, Principal Component Analysis),主坐标分析(PCoA,Principal Co-ordinates Analysis),非加權組平均聚類分析(UPGMA,Unweighted Pair-group Method withArithmetic Means)等分析方法,從中發現不同樣品(組)間的差異。

2.PCA & PCoA分析

  • 主成分分析(PCA)是多變量統計學中最為人熟知的分析方法,它通過線性變換,将原始的高維數據投影至少量新合成的變量(即主成分),從而簡化數據結構,展現樣品的自然分布。

  • 主成分分析不考慮原始變量之間可能存在的相互關系,并且是基于歐式距離評價樣品之間的相似度。

  • 多維尺度分析與主成分分析類似,但是它可以采用任何距離評價樣品之間的相似度。主坐标分析(Principalcoordinates analysis,PCoA)是經典的多維尺度分析方法。

3. UniFrac距離

  • 由于微生物極其多樣,不同微生物彼此之間的系統發育關系往往千差萬别,僅僅将群落中不同微生物成員視為相互獨立的變量顯然并不合理。

  • 因此,在比較不同群落樣品之間的差異時,需要考慮兩個群落成員之間的系統發育關系是否相似。

  • 基于這個思想,計算微生物群落樣品間距離的UniFrac距離應運而生,通過比較兩個群落各自獨有的微生物成員之間系統發育關系的遠近,更為客觀地反映兩個群落樣品之間的相似程度

UniFrac距離有:

1)非加權(Unweighted)

  • 僅僅考慮微生物成員在群落中存在與否,而不考慮其豐度高低。

2)加權(Weighted)

  • 兼顧群落成員之間的系統發育關系以及它們在各自群落中的豐度高低。

  • 兩種距離算法側重于不同的群落結構特征:究竟是由于群落成員的截然不同導緻樣品的差異,還是由于同一組成員在不同樣品中豐度梯度的改變導緻樣品的差異。

  • 由于主坐标分析是以“無監督”的方式降維分解樣品距離矩陣,因此,合理運用非加權和加權兩種UniFrac距離,可以較全面地揭示微生物群落數據背後隐含的生态學意義(即UniFrac PCoA分析)。

4. 聚類分析

聚類分析:通過等級樹的形式展示樣品間的差異大小。

※ 與多維尺度分析相同,聚類分析可以采用任何距離評價樣品之間的相似度。

常用的聚類分析方法包括:

1)非加權組平均法(Unweightedpair-group method with arithmetic means,UPGMA)

2)單一連接法(Single-linkageclustering)

3)完全連接法(Complete-linkageclustering)

4)……等。

你可能想看:

有話要說...

取消
掃碼支持 支付碼