當前位置:首頁 > 健康養生 > 正文

教你看懂基因檢測中的那些變異

随着基因檢測技術的迅速發展和普及應用,越來越多的人開始接觸到了基因檢測。報告中成堆成串的字母數字專業名詞,單個看都認識,合着一起看就不認識了。

那麼這期我們就從這個點來切入,教你看懂基因變異。學會了這期,看懂報告中的變異内容就輕而易舉了。

前言






“突變是指核苷酸序列永久性改變,多态性是指人群頻率超過1%的變異。這兩個術語已經錯誤地與緻病性和良性結果關聯起來,因此,建議使用“變異”加以下五個修飾詞替代上述兩個術語: 緻病性的、可能緻病性的、意義不明确的、可能良性的或良性的。”

——ACMG指南

根據HGVS(人類基因組變異協會)變異命名法以及ACMG指南,建議使用“變異”這個中性詞來描述核苷酸的改變。


正确完整的變異結果描述應該包含基因名稱,變異的位置,轉錄本及外顯子,還有核苷酸的改變以及氨基酸改變。


01




變異前綴

變異的前綴用于指出變異位于哪種序列中:

“g.”表示基因組序列,如g.455G>T。

“c.”表示Coding(編碼)DNA序列,如c.455G>A。

“m.”表示線粒體DNA序列,如m.766T>C。

“n.”表示非編碼RNA序列。

“r.”表示RNA序列,如r.76a>u。

“p.”表示蛋白質序列,如p.Lys76Asn。

3’規則

對于突變的所有描述,最靠近參考序列3'端的描述優先考慮;應用于所有關于基因組,基因,轉錄本,蛋白的相關突變描述。

這句話怎麼理解呢?序列從5’端向3’端讀取,描述靠近3’端的變化。例如:CTAGAGGTC這段序列變異為CTAGGTC,我們優先描述為缺失後面的AG,而不是前面的AG。通俗地講就是“能往下讀就往下讀,讀不動了再說”。


02




變異描述的總體規範

1、表述符号

“>”(大于号)表示堿基替換,如c.123G>A。

“del”表示缺失,如c.76delA。

“dup”表示重複,如c.76dupA。

“ins”表示插入,如c.76_77insG。

“delins”表示同時有缺失和插入,如c.112_117delinsTG。

“inv”表示倒位,如c.76_83inv。

“con”表示轉換,如NC_000022.10:g.42522624_42522669con42536337_42536382。

“fs”表示移碼(frame shift),變異導緻在起始密碼子和終止密碼子之間的開放閱讀框發生改變,如p.Arg456GlyfsTer17(或p.Arg456Glyfs * 17)。

“ext”表示延伸(extension),變異發生在起始密碼子或終止密碼子上,導緻氨基酸序列較之原序列變長了。如p.Met1 ext -5。

特定含義的字符






“+”用于核苷酸編号;c.123 + 45A>G

“-”用于核苷酸編号;c.124-56C>T

“*”用于核苷酸編号并表示翻譯終止(終止)密碼子;c.* 32G> A 或 P.Trp41 *

“_”用于表示範圍;g.12345_12678del

“[ ]”用于等位基因:

  • “; ”用于分開變異和等位基因;g.[123A>G; 345G>C]或g.[123A> G]; [345G> C]

  • “,”用于分開源自一個等位基因的不同轉錄物或蛋白質;r.[123a> t,122_154del]

“:”用于将參考序列與變異描述分開; NC_000011.9:g.1234G>A

“()”用于表示不确定性和預測後果; NC_000023.9:g.(1234_2345)_(3456_4567)del,p.(Ser123Arg)


注意:不确定性的範圍應盡可能精确地描述

  • “?“用于表示未知位置; g.(?_ 2345)_(3456 _?)del

  • “^”用于或者的意思;c.(370A>C ^372C>R)作為p.Ser124Arg的反向翻譯

  • “=”用于表示未被發現的測試序列; p.(Arg234=)

  • “/”用于表示嵌合體(同合子)

  • “//”用于表示嵌合體(不同合子)


2、表述内容

DNA:

前綴(c.)+位置編号(76)+參考序列堿基(A) +變化(>) +改變後的堿基(如果有)(T):c.76A>T。

堿基以大寫字母表示,包括A、T、G、C、Y、R、W等。

RNA:

前綴(r.)+位置編号(39)+參考序列堿基(a) +變化(>) +改變後的堿基(如果有)(u):r.39a>u。

堿基以小寫字母表示,包括a、u、g、c、y、r、w等。

蛋白:

前綴(p.)+參考序列氨基酸(Trp)+位置編号(52)+變化(沒有“>”,但“del”、“ins”等不變)+改變後的氨基酸(如果有)(Ala):p.Trp52Ala。

氨基酸以三字母(第一個字母大寫)或單字母表示,如Trp或W。

  • 建議以三字母表示(第一個字母大寫),不建議以單字母表示,因為單字母容易和堿基混淆。


03




具體内容

替換


替換(substitution):一個堿基/氨基酸被另一個堿基/氨基酸替換。

特征是“一對一”。

如果是一個變異成多個,那是缺失-插入。

如果是多個變異成一個,那是缺失或缺失-插入。

如果是多個變異成多個,那是缺失-插入或轉換。

因此沒有“c.76_77AG>TT”這種寫法。

用“>”(英文輸入法的大于号)表示某個堿基變成了另一個堿基,但是氨基酸替換沒有“>”,要寫成“p.Trp52Ala”這樣的形式。

舉例:c.76A>T,p.Glu26Asp。

缺失


缺失(deletion):原本有的沒有了。

舉例:c.76del或c.76delA;c.76_78del或c.76_78delACT;p.Gln8del;p.Gln8_Ala10del。

需要用到3’法則(most 3’ position):缺失的堿基,認為其靠近3’端,而不是5’端。

CTAGAGGTC這段序列變異為CTAGGTC,我們優先描述為缺失後面的AG,而不是前面的AG。通俗地講就是“能往下讀就往下讀,讀不動了再說”。

但是該法則有例外,在描述外顯子/内含子邊界的變異時,認為缺失的堿基影響外顯子大于影響内含子。如CAGgtg變成CAgtg,寫成c.3delG,而非c.3+1delG。

不确定斷裂位置的情況(見于使用MLPA和PCR法發現的外顯子缺失),要使用圓括号和預估的斷裂位置範圍,例如:

  • c.(87+1_88-1)_(300+1_301-1)del,表示某基因Exon3、4缺失,5’斷裂點在Intron2(c.87+1_88-1,不确定具體在哪處),3’斷裂點在Intron4(c.300+1_301-1,不确定具體在哪處)

  • c.(?_-30)_(12+1_13-1)del,表示從基因5’某個位置開始至Intron1中的某個位置缺失。

  • c.(?_-1)_(*1_?)del,表示整個基因都缺失了。

提醒:不要随便打“?”。能确定具體斷裂位置就不要打問号。

重複


重複(duplication):堿基或氨基酸多出了一份拷貝(不是多份拷貝),并且多出來的部分直接加在其3’端。

舉例:c.7dup或c.7dupT(注意不寫成c.7_8insT);c.77_79dup或c.77_79dupCTG;c.(87+1_88-1)_(301+1_302-1)dup;

p.Gly4_Gln6dup;

描述重複的位置時也須符合“最靠近3’端法則”。

例如:MKMGHQHQCC變成MKMGHQHQHQCC,寫成p.His7_Gln8dup,不寫成p.His5_Gln6dup.

多份重複


多份拷貝重複(repeat):堿基或氨基酸多出了多份拷貝,并且多出來的部分直接加在其3’端。

表示形式:“第一個重複單元起始位置_第一個重複單元終止位置+[總共的重複數]”,如c.123_124[4]。

或者,“第一個重複單元起始位置+重複單元+[總共的重複數]”,如c.123TG[4]。

不用“c.123_124TG[4]”形式表示——顯得冗餘。

特殊舉例:

脆性X綜合症FMR1基因5’端重複單元:c.-128_-126[79]——确定共有79個重複單元;c.-128_-126[(600_800)]——重複單元數在600~800之間,具體數量不确定(通過Southern Blot做出的結果)。不要寫成c.-128GGC[79],因為該基因中有的GGC重複單元可能變異為GGA單元,寫成c.-128GGC[79]就不符合實際情況。

群體研究:g.1209_4523[12_45]——該片段在人群中重複12~45次不等。

插入


插入(insertion):原本沒有的卻有了,且多出的部分不是其5’端緊鄰的堿基或氨基酸的拷貝——和“重複”的區别。

舉例:c.51_52insGAGA;

c.123+54_123+55insAB012345.2:g.76_420;

p.Lys2_Met3insGlnSerLys;p.Trp182_Gln183ins17;

注意:

所描述插入位置一定是由下劃線連接起來的範圍,而非單個點。“c.51_52insGAGA”清晰的表明了插入位置是在c.51和c.52之間。“c.51insGAGA”就會引起混淆:插入位置是在c.51的5’端還是3’端?

不确定時需打圓括号,如

  • “c.(67_70)insG”——不确定是在c.67~c.70間的哪個位置插入了G;

  • “c.11_12ins(2)”或者“c.11_12insNN”——确定插入了兩個堿基,但不确定插入的堿基序列是什麼;

  • “c.11_12ins(100)”或者“c.11_12insN[100]”——确定插入了100個堿基,但不确定插入的堿基序列是什麼;

如果插入DNA或RNA的堿基很多(多到無法把所有插入的堿基都寫出來),應盡量尋找所插入的堿基來源,加入到描述中,

如“c.123+54_123+55insAB012345.2:g.76_420”。

缺失-插入


先缺失,再插入。同時滿足缺失和插入的表述規範。

舉例:

c.112_117delinsTG(c.112_117delAGGTCAinsTG)

c.113delinsTACTAGC(c.113delGinsTACTAGC);

p.Cys28delinsTrpVal

在碼變異


在碼變異(in frame):一個或多個氨基酸變成另外的一個或多個氨基酸,但其它氨基酸編碼不受影響。DNA的單堿基替換,或堿基缺失/增加的數量是3的倍數,可導緻在碼變異。

在碼變異的表述:沒有“fs”,

如“p.Gln8_Ala10del”;“p.Cys28delinsTrpVal”

移碼變異


移碼變異(frame shift):DNA的堿基缺失或增加不是3的倍數,造成在起始密碼子和終止密碼子之間的開放閱讀框發生了變化。變異發生處C端下遊的氨基酸編碼都受到影響。

移碼變異的表述:

1、短描述:前綴+受影響的第一個氨基酸+fs,如“p.Arg97fs”。

2、長描述(推薦采用):前綴+受影響的第一個氨基酸的變異情況+fsTer(或fs*)+變異後的新終止位置,如“p.Arg97Glyfs*26”。

不要加入“del”、“ins”、“dup”等字眼。

關于确定變異後新的終止位置:

受影響的第一個氨基酸确立為1,然後再新的開放閱讀框中,其C端下遊的氨基酸依次編号為2、3……#。#即為終止密碼子所對應的氨基酸位置編号。把#直接連在“fsTer”或“fs*”的後面。

舉例:變異後新的開放閱讀框為

Trp112(受影響的第一個氨基酸,原本是Asn), Ala113, Gln114, Asp115, Leu116, *117。

則變異寫作“p.Asn112Trpfs*6”(117-112+1=6),不是寫作

“p.Asn112Trpfs*5”,“p.Asn112Trpfs*117” ,

亦或“p.Asn112Trpfs*118”。

在變異後新的開放閱讀框中沒有發現終止密碼子,則“#”用“?”代替,如“p.Ile327Argfs*?”。

氨基酸特殊變化


同義變化:氨基酸沒有改變,用“p.(=)”表示。

無義變化:用“Ter”或“*”(英文輸入法且英文字體下的星号鍵)表示氨基酸翻譯終止。

第一氨基酸的變化:

因為啟動子區或起始密碼子變異導緻沒有蛋白翻譯出來,并提供了實驗數據支持,則用“p.0”表示。

因為啟動子區或起始密碼子的變異推測沒有蛋白翻譯出來,不能提供實驗數據支持(這種情況較常見),則用“p.0?”或“p.Met1?”表示。

其他變異


倒位(invertion):

如c.203_506inv或c.203_506inv304。

轉換(conversion):

如g.123_678conNG_012232.1:g.9456_10011。

易位(translocation):

如t(X;4)(p21.2;q35)(c.301-148_301-147)。

重排(rearrangement detected by FISH and Array):

如hg19 chrX:g.(3221_3223)_(3298_3325)del。

嵌合(mosaicism and chimerism):

如c.[83G=/83G>C],c.[=//83G>C]。

在同一等位基因上/在不同等位基因上/不确定是否在同一等位基因上:

如c.[76A>C;83G>C],c.[76A>C];[83G>C],

c.[76A>C(;)83G>C],p.[Trp13*; Pro43Ala],

p.[Trp13*];[Cys28Arg]。

産前診斷中心小程序已上線

檢查單配送

交易擔保 産前診斷 鄭大一附院産前診斷雲平台 小程序

你可能想看:

有話要說...

取消
掃碼支持 支付碼