随着基因檢測技術的迅速發展和普及應用,越來越多的人開始接觸到了基因檢測。報告中成堆成串的字母數字專業名詞,單個看都認識,合着一起看就不認識了。
那麼這期我們就從這個點來切入,教你看懂基因變異。學會了這期,看懂報告中的變異内容就輕而易舉了。
前言
“突變是指核苷酸序列永久性改變,多态性是指人群頻率超過1%的變異。這兩個術語已經錯誤地與緻病性和良性結果關聯起來,因此,建議使用“變異”加以下五個修飾詞替代上述兩個術語: 緻病性的、可能緻病性的、意義不明确的、可能良性的或良性的。”
——ACMG指南
根據HGVS(人類基因組變異協會)變異命名法以及ACMG指南,建議使用“變異”這個中性詞來描述核苷酸的改變。
正确完整的變異結果描述應該包含基因名稱,變異的位置,轉錄本及外顯子,還有核苷酸的改變以及氨基酸改變。
01
變異前綴
變異的前綴用于指出變異位于哪種序列中:
“g.”表示基因組序列,如g.455G>T。
“c.”表示Coding(編碼)DNA序列,如c.455G>A。
“m.”表示線粒體DNA序列,如m.766T>C。
“n.”表示非編碼RNA序列。
“r.”表示RNA序列,如r.76a>u。
“p.”表示蛋白質序列,如p.Lys76Asn。
3’規則
對于突變的所有描述,最靠近參考序列3'端的描述優先考慮;應用于所有關于基因組,基因,轉錄本,蛋白的相關突變描述。
這句話怎麼理解呢?序列從5’端向3’端讀取,描述靠近3’端的變化。例如:CTAGAGGTC這段序列變異為CTAGGTC,我們優先描述為缺失後面的AG,而不是前面的AG。通俗地講就是“能往下讀就往下讀,讀不動了再說”。
02
變異描述的總體規範
1、表述符号
“>”(大于号)表示堿基替換,如c.123G>A。
“del”表示缺失,如c.76delA。
“dup”表示重複,如c.76dupA。
“ins”表示插入,如c.76_77insG。
“delins”表示同時有缺失和插入,如c.112_117delinsTG。
“inv”表示倒位,如c.76_83inv。
“con”表示轉換,如NC_000022.10:g.42522624_42522669con42536337_42536382。
“fs”表示移碼(frame shift),變異導緻在起始密碼子和終止密碼子之間的開放閱讀框發生改變,如p.Arg456GlyfsTer17(或p.Arg456Glyfs * 17)。
“ext”表示延伸(extension),變異發生在起始密碼子或終止密碼子上,導緻氨基酸序列較之原序列變長了。如p.Met1 ext -5。
特定含義的字符
“+”用于核苷酸編号;c.123 + 45A>G
“-”用于核苷酸編号;c.124-56C>T
“*”用于核苷酸編号并表示翻譯終止(終止)密碼子;c.* 32G> A 或 P.Trp41 *
“_”用于表示範圍;g.12345_12678del
“[ ]”用于等位基因:
“; ”用于分開變異和等位基因;g.[123A>G; 345G>C]或g.[123A> G]; [345G> C]
“,”用于分開源自一個等位基因的不同轉錄物或蛋白質;r.[123a> t,122_154del]
“:”用于将參考序列與變異描述分開; NC_000011.9:g.1234G>A
“()”用于表示不确定性和預測後果; NC_000023.9:g.(1234_2345)_(3456_4567)del,p.(Ser123Arg)
注意:不确定性的範圍應盡可能精确地描述
“?“用于表示未知位置; g.(?_ 2345)_(3456 _?)del
“^”用于或者的意思;c.(370A>C ^372C>R)作為p.Ser124Arg的反向翻譯
“=”用于表示未被發現的測試序列; p.(Arg234=)
“/”用于表示嵌合體(同合子)
“//”用于表示嵌合體(不同合子)
2、表述内容
DNA:
前綴(c.)+位置編号(76)+參考序列堿基(A) +變化(>) +改變後的堿基(如果有)(T):c.76A>T。
堿基以大寫字母表示,包括A、T、G、C、Y、R、W等。
RNA:
前綴(r.)+位置編号(39)+參考序列堿基(a) +變化(>) +改變後的堿基(如果有)(u):r.39a>u。
堿基以小寫字母表示,包括a、u、g、c、y、r、w等。
蛋白:
前綴(p.)+參考序列氨基酸(Trp)+位置編号(52)+變化(沒有“>”,但“del”、“ins”等不變)+改變後的氨基酸(如果有)(Ala):p.Trp52Ala。
氨基酸以三字母(第一個字母大寫)或單字母表示,如Trp或W。
建議以三字母表示(第一個字母大寫),不建議以單字母表示,因為單字母容易和堿基混淆。
03
具體内容
替換
替換(substitution):一個堿基/氨基酸被另一個堿基/氨基酸替換。
特征是“一對一”。
如果是一個變異成多個,那是缺失-插入。
如果是多個變異成一個,那是缺失或缺失-插入。
如果是多個變異成多個,那是缺失-插入或轉換。
因此沒有“c.76_77AG>TT”這種寫法。
用“>”(英文輸入法的大于号)表示某個堿基變成了另一個堿基,但是氨基酸替換沒有“>”,要寫成“p.Trp52Ala”這樣的形式。
舉例:c.76A>T,p.Glu26Asp。
缺失
缺失(deletion):原本有的沒有了。
舉例:c.76del或c.76delA;c.76_78del或c.76_78delACT;p.Gln8del;p.Gln8_Ala10del。
需要用到3’法則(most 3’ position):缺失的堿基,認為其靠近3’端,而不是5’端。
CTAGAGGTC這段序列變異為CTAGGTC,我們優先描述為缺失後面的AG,而不是前面的AG。通俗地講就是“能往下讀就往下讀,讀不動了再說”。
但是該法則有例外,在描述外顯子/内含子邊界的變異時,認為缺失的堿基影響外顯子大于影響内含子。如CAGgtg變成CAgtg,寫成c.3delG,而非c.3+1delG。
不确定斷裂位置的情況(見于使用MLPA和PCR法發現的外顯子缺失),要使用圓括号和預估的斷裂位置範圍,例如:
c.(87+1_88-1)_(300+1_301-1)del,表示某基因Exon3、4缺失,5’斷裂點在Intron2(c.87+1_88-1,不确定具體在哪處),3’斷裂點在Intron4(c.300+1_301-1,不确定具體在哪處)
c.(?_-30)_(12+1_13-1)del,表示從基因5’某個位置開始至Intron1中的某個位置缺失。
c.(?_-1)_(*1_?)del,表示整個基因都缺失了。
提醒:不要随便打“?”。能确定具體斷裂位置就不要打問号。
重複
重複(duplication):堿基或氨基酸多出了一份拷貝(不是多份拷貝),并且多出來的部分直接加在其3’端。
舉例:c.7dup或c.7dupT(注意不寫成c.7_8insT);c.77_79dup或c.77_79dupCTG;c.(87+1_88-1)_(301+1_302-1)dup;
p.Gly4_Gln6dup;
描述重複的位置時也須符合“最靠近3’端法則”。
例如:MKMGHQHQCC變成MKMGHQHQHQCC,寫成p.His7_Gln8dup,不寫成p.His5_Gln6dup.
多份重複
多份拷貝重複(repeat):堿基或氨基酸多出了多份拷貝,并且多出來的部分直接加在其3’端。
表示形式:“第一個重複單元起始位置_第一個重複單元終止位置+[總共的重複數]”,如c.123_124[4]。
或者,“第一個重複單元起始位置+重複單元+[總共的重複數]”,如c.123TG[4]。
不用“c.123_124TG[4]”形式表示——顯得冗餘。
特殊舉例:
脆性X綜合症FMR1基因5’端重複單元:c.-128_-126[79]——确定共有79個重複單元;c.-128_-126[(600_800)]——重複單元數在600~800之間,具體數量不确定(通過Southern Blot做出的結果)。不要寫成c.-128GGC[79],因為該基因中有的GGC重複單元可能變異為GGA單元,寫成c.-128GGC[79]就不符合實際情況。
群體研究:g.1209_4523[12_45]——該片段在人群中重複12~45次不等。
插入
插入(insertion):原本沒有的卻有了,且多出的部分不是其5’端緊鄰的堿基或氨基酸的拷貝——和“重複”的區别。
舉例:c.51_52insGAGA;
c.123+54_123+55insAB012345.2:g.76_420;
p.Lys2_Met3insGlnSerLys;p.Trp182_Gln183ins17;
注意:
所描述插入位置一定是由下劃線連接起來的範圍,而非單個點。“c.51_52insGAGA”清晰的表明了插入位置是在c.51和c.52之間。“c.51insGAGA”就會引起混淆:插入位置是在c.51的5’端還是3’端?
不确定時需打圓括号,如
“c.(67_70)insG”——不确定是在c.67~c.70間的哪個位置插入了G;
“c.11_12ins(2)”或者“c.11_12insNN”——确定插入了兩個堿基,但不确定插入的堿基序列是什麼;
“c.11_12ins(100)”或者“c.11_12insN[100]”——确定插入了100個堿基,但不确定插入的堿基序列是什麼;
如果插入DNA或RNA的堿基很多(多到無法把所有插入的堿基都寫出來),應盡量尋找所插入的堿基來源,加入到描述中,
如“c.123+54_123+55insAB012345.2:g.76_420”。
缺失-插入
先缺失,再插入。同時滿足缺失和插入的表述規範。
舉例:
c.112_117delinsTG(c.112_117delAGGTCAinsTG)
c.113delinsTACTAGC(c.113delGinsTACTAGC);
p.Cys28delinsTrpVal
在碼變異
在碼變異(in frame):一個或多個氨基酸變成另外的一個或多個氨基酸,但其它氨基酸編碼不受影響。DNA的單堿基替換,或堿基缺失/增加的數量是3的倍數,可導緻在碼變異。
在碼變異的表述:沒有“fs”,
如“p.Gln8_Ala10del”;“p.Cys28delinsTrpVal”
移碼變異
移碼變異(frame shift):DNA的堿基缺失或增加不是3的倍數,造成在起始密碼子和終止密碼子之間的開放閱讀框發生了變化。變異發生處C端下遊的氨基酸編碼都受到影響。
移碼變異的表述:
1、短描述:前綴+受影響的第一個氨基酸+fs,如“p.Arg97fs”。
2、長描述(推薦采用):前綴+受影響的第一個氨基酸的變異情況+fsTer(或fs*)+變異後的新終止位置,如“p.Arg97Glyfs*26”。
不要加入“del”、“ins”、“dup”等字眼。
關于确定變異後新的終止位置:
受影響的第一個氨基酸确立為1,然後再新的開放閱讀框中,其C端下遊的氨基酸依次編号為2、3……#。#即為終止密碼子所對應的氨基酸位置編号。把#直接連在“fsTer”或“fs*”的後面。
舉例:變異後新的開放閱讀框為
Trp112(受影響的第一個氨基酸,原本是Asn), Ala113, Gln114, Asp115, Leu116, *117。
則變異寫作“p.Asn112Trpfs*6”(117-112+1=6),不是寫作
“p.Asn112Trpfs*5”,“p.Asn112Trpfs*117” ,
亦或“p.Asn112Trpfs*118”。
在變異後新的開放閱讀框中沒有發現終止密碼子,則“#”用“?”代替,如“p.Ile327Argfs*?”。
氨基酸特殊變化
同義變化:氨基酸沒有改變,用“p.(=)”表示。
無義變化:用“Ter”或“*”(英文輸入法且英文字體下的星号鍵)表示氨基酸翻譯終止。
第一氨基酸的變化:
因為啟動子區或起始密碼子變異導緻沒有蛋白翻譯出來,并提供了實驗數據支持,則用“p.0”表示。
因為啟動子區或起始密碼子的變異推測沒有蛋白翻譯出來,不能提供實驗數據支持(這種情況較常見),則用“p.0?”或“p.Met1?”表示。
其他變異
倒位(invertion):
如c.203_506inv或c.203_506inv304。
轉換(conversion):
如g.123_678conNG_012232.1:g.9456_10011。
易位(translocation):
如t(X;4)(p21.2;q35)(c.301-148_301-147)。
重排(rearrangement detected by FISH and Array):
如hg19 chrX:g.(3221_3223)_(3298_3325)del。
嵌合(mosaicism and chimerism):
如c.[83G=/83G>C],c.[=//83G>C]。
在同一等位基因上/在不同等位基因上/不确定是否在同一等位基因上:
如c.[76A>C;83G>C],c.[76A>C];[83G>C],
c.[76A>C(;)83G>C],p.[Trp13*; Pro43Ala],
p.[Trp13*];[Cys28Arg]。
産前診斷中心小程序已上線
檢查單配送
交易擔保 産前診斷 鄭大一附院産前診斷雲平台 小程序
上一篇
八字直觀論命
有話要說...