寫在前面:知識真是越看越多,聰明的人類總能想出各種辦法來尋找這世界萬物中的各種聯系。文獻中讀到Mendelian randomization method and a Mendelian randomization-Egger sensitivity analysis,真是焦頭爛額,查了查資料來做筆記了。這篇筆記的基礎來自一篇中文文獻,
英文來源:
孟德爾随機化(Mendelian Randomization,MR)研究設計,遵循“親代等位基因随機分配給子代”的孟德爾遺傳規律,如果基因型決定表型,基因型通過表型而與疾病發生關聯,因此可以使用基因型作為工具變量來推斷表型與疾病之間的關聯。關聯zy=關聯zx×關聯xy,見圖。
Greenland對工具變量在流行病學混雜因素控制方面的應用做了詳細闡述:
①工具變量z與混雜因素u無關聯;
②工具變量z與暴露因素x有關聯;
③工具變量z與結局變量Y無關聯,z隻能通過變量X與Y發生關聯。
上述方程的使用必須滿足條件:
①變量x與Y之間的關聯一定會受到潛在混雜因素U的影響,但工具變量z與變量x以及z與變量Y之間無潛在混雜因素影響;
②變量x與結局Y之間的關聯無法直接觀察獲得,因為無法直接測量變量X,但是z是可測量的,并且z與x直接的關聯是已知的或者可測量的,并獨立于其他因素而存在。
這些對于工具變量的限制條件也使得正确選擇合适的工具變量成為關聯研究的難點。
①一階段MR(One stage MR):
②獨立樣本MR(One-sample MR):該方法利用單一研究樣本,通過使用2階段最小二乘法回歸模型(2-stage least—squares regression,2SLS),定量估計暴露因素x與Y之間的關聯效應大小。第一步:建立G—X回歸模型,獲得暴露因素預測值(predicted value,P);第二步:構建P—Y的回歸模型,即獲得暴露因素預測值P和結局變量Y之間的回歸方程。
由于該方法局限于單個樣本,把握度較小,工具變量的選擇也比較局限,容易受到潛在混雜因素的影響。2SLS的分析方法在Stata軟件中可以使用“ivregress”(StataCorp)、在R軟件中使用“ivpack”(R Foundation)來實現。
③兩樣本MR(Two-sample MR):兩樣本MR的設計策略是建立在G—X和G—Y的關聯研究人群來自相同人群的兩個獨立樣本(如GWAS與暴露,GWAS與結局的關聯數據n9。),要求兩樣本具有相似的年齡、性别和種族分布特征,因為樣本量較大,該方法可以獲得更大的把握度。目前,兩樣本MR因為全球大量GWAS合作組的公共數據而被廣泛使用。
④雙向MR(Bidirectional MR):又稱為互為MR(Reciprocal MR)
此方法在解決因果網絡方向的問題上将會有很大用途,但是在分析未知生物學效應的兩個變量時,要防止被雙向MR的結果誤導。
⑤兩階段MR(Two-step MR):與兩樣本MR不同的是,兩階段MR需要使用遺傳工具變量來評價因果關聯的可能中間變量M(Mediation),來探讨環境暴露因素(E)是否通過表觀遺傳指标(M)而導緻疾病(O)改變,見圖
第一階段,遺傳工具變量G1獨立于混雜因素,指代暴露因素E與結局O之問的關聯,并且必須經過中間變量M才能實現;
第二階段,另一獨立遺傳工具變量G2作為中間變量M的指代工具,分析中間變量M與結局0之間的關聯
比如BMI通過血壓來間接影響冠心病的發生。目前此方法已被應用于表觀遺傳流行病學(Epigenetic Epidemiology)研究,Binder和Michels使用母親MTHFR C677T,A1298C兩位點作為工具變量,發現7個CpG位置參與了紅細胞葉酸與甲基化改變之間的關聯。Dekkers等陋63使用全基因組甲基化數據發現,免疫細胞差異甲基化結果是由個體内部血脂水平(TG,LDL-C,HDL-C)變化所導緻,反之則不亦然。此方法必須滿足E—M和E—O之間的關聯呈線性以及同質性的假設前提,并且已被延伸成為分析複雜因果網絡關系的基礎,如網絡MR設計(Network MR)。
⑥基因一暴露交互作用MR(Gene-exposure interactions)interactions):MR研究設計還可以用于探讨基因一暴露因素在疾病發生中的交互作用現象,同時要求基因與結局的關聯必須取決于暴露因素的狀态。這種方法可以區分基因直接作用于結局,還是基因通過暴露因素而作用于結局。
1.敏感度分析(sensitivity analysis)
2.MR-Egger回歸分析:以使用MR—Egger回歸分析的方法來評價基因多效性帶來的偏倚,MR-Egger回歸直線的斜率可以估計定向多效性(directional pleiotropy)的大小。
Beavis效應:基于GWAS數據的MR研究可能會高估了遺傳和暴露之間的關聯,亦被稱之為“勝利者的詛咒(the winner’s curse)
這篇有例子有實戰,不錯:
Technical Report | 29 October 2018
This study presents a new latent causal variable (LCV) model that distinguishes between genetic correlation and…show more
Luke J. O’Connor &Alkes L. Price
号稱比孟德爾随機化還好的model,避免了假陽性,可以看看
附上軟件網址:
有話要說...