1. QTL( Trait Locus)及其定位原理、常用方法
QTL ( trait locus):代表染色體上影響數量性狀的某個區段,區段内可能會有一個甚至多個影響數量性狀的功能基因
QTL定位的目的:定位影響數量性狀的功能基因
QTL定位的基本原理:當标記與控制特定性狀基因連鎖時,不同标記基因型的表型值存在顯著差異,通過分析表型與标記間的相關性,就可以确定控制數量性狀的基因在染色體上的位置及效應
QTL定位的基本步驟:分離世代群體建立,遺傳标記檢測,表型測定,統計分析,候選基因鑒定
2. LOD值( of the odds score)及如何确定其阈值?
LOD值: of the odds score,LOD=log10(L1/L0),L1是這個位點有QTL的概率,L0是這個位點無QTL的概率。如果LOD=3,則意味着這個位點有QTL的概率是無QTL的概率的1000倍。
LOD置信區間:2-LOD置信區間就是LOD波動曲線從峰的最大值降低2的時候(Y軸), 對應在遺傳圖譜上跨越的區域(X軸)。2-LOD置信區間大概對應99.8%的置信區間,即功能基因有99.8%概率已經落在這個區域内了
顯著性阈值的确定—— test
3. 全基因組關聯分析(-wide study, GWAS)的原理及優缺點
全基因組關聯分析 (-Wide Study, GWAS)是連接遺傳變異 ( , GVs)和表型 ()的主要工具。
4. 連鎖不平衡( )會造成什麼問題?為什麼?
連鎖不平衡(LD)是指給定種群中不同基因座(位點)上的等位基因之間的非随機關聯性,即分屬兩個或兩個以上基因座位的等位基因同時出現的頻率高于預期的現象。
(1)連鎖不平衡使得基因關聯分析的解釋變得困難,在進行基因關聯分析時,如果存在LD,即使兩個基因座之間沒有功能相關性,它們也可能顯示出關聯。這使得解釋不同基因座與特定性狀之間的關系變得困難。
(2)遺傳定位的精度受限,當一個基因座與一個性狀相關的基因座緊密連鎖時,很難确定哪個基因座是導緻性狀的真正原因,可能使得全基因組關聯分析研究和基因定位研究中的假陽性和假陰性結果。
(3)多重比較校正,由于基因座之間的關聯,相關性檢驗的結果可能會導緻大量的假陽性關聯,需要進行多種比較矯正,以降低錯誤發現的概率。
(4)遺傳分析的複雜性增加:當進行基因型推斷、基因頻率估計和遺傳模型建立時,需要考慮并糾正LD的影響,否則會導緻偏誤估計和錯誤的結果解釋。
5. 群體結構及其影響?
6. 什麼是混合線性模型?為何GWAS要用混合線性模型?
混合線性模型在GWAS中被廣泛使用,可以有效地控制人口結構和近交效應的影響,并考慮随機效應的影響,從而提高關聯分析的準确性和可靠性。
7. 親緣關系()矩陣及其作用?
在使用混合線性模型進行全基因組關聯分析時,親緣關系矩陣的作用包括以下幾個方面:
(1)控制人口結構和近交效應
(2)估計随機效應
(3)處理缺失數據
8. 哪些因素決定全基因組關聯分析和QTL定位的精度?
最根本性的因素: (1)重組事件的數目;
可推及的其他因素:(2)标記的數目{要比重組事件多才能檢測出重組};
(3)群體大小{群體大了,重組事件多};
(4)群體結構的影響{群體隔離和受選擇都會降低重組率};
(5)群體的類型{不同的群體,重組率差别很大;是否有雜合基因型也有影響};
另一個因素是表型方面:(6)表型的遺傳率和測量誤差的影響;
還有就是方法是否合适:(7)模型的選擇{線性模型/混合模型};
(8)位點之間是否存在複雜的互作。
9. 曼哈頓圖和QQ-plot
在GWAS(基因組關聯研究)中,plot(- plot,分位數-分位數圖)是一種常用的統計圖形,用于評估GWAS結果中的關聯統計量是否偏離了預期的分布。
10. 缺失基因型填補()的概念
有話要說...