廣州市黃埔區學大道攬月路廣州企業孵化器B座402
電話:020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
如何通過3D基因組研究結構變異
日期:2018-11-15 標簽:結構變異,位置效應,3D基因組測序技術,Hi-C
最近研究表明,結構變異(structural variation,SV)不僅可以影響基因劑量,而且是基因調控的基本機制。SV可以改變調控元件的拷貝數,或者通過破壞染色體的高級結構如TAD來影響基因組的3D結構。由于這些位置效應,SV可以影響離SV斷點很遠的基因表達,從而導致疾病的發生。SV對3D基因組和基因表達調控的影響,已經被認為是導致疾病發生的潛在原因。
結構變異(SV)包括刪除(deletions),重復(duplications),倒位(inversions),插入(insertions)和易位(translocations)。高通量測序技術大大加快了發現和表征這些SVs,然而,在醫學上解釋SVs和疾病表型結果,仍然不盡人意。SVs可以在不改變編碼基因序列情況下導致疾病的發生,這暗示著SV可能作為一個調控原件發揮作用,即所謂的位置效應。事實上,基因組98%的區域都是非編碼區域,因此大部分非編碼區域可能以某種方式參與基因的調控,但是具體有多少區域參與調控仍然不清楚。因而SV通過影響順式調控元件(如啟動子和增強子)的位置和/或功能,參與基因的調控,成為了非編碼區域調控的熱點。最近隨著3D基因組測序技術發展,位置效應作為調控的熱點的證據越來越明顯。因而小編堅信接下來用Hi-C鑒定結構變異,揭示基因調控原理,闡明性狀產生的根本原因必然是動植物基因組結構變異研究的熱點。下面具體介紹一下Hi-C做結構變異的原理。
在細胞核級別,染色體占據特定的領域(下圖)。在染色體水平上,Hi-C技術已經揭示了染色質可以分為開放和閉合的空間,稱為A/B隔室。A與可接近的,轉錄活性的常染色質緊密相關,B與不可接近的,轉錄沉默異染色質相關(見圖)。隨著測序深度和分辨率的增加,隔室被細分為為拓撲結構域(TADs)。在Hi-C實驗中TADs鑒定主要依據在邊界地區交互作用減少(見圖)。在TADs內部,調控元件與調控的基因相互作用,激活基因的轉錄。組蛋白H3K27ac和ATAC-seq可用于鑒定活性調控元件(見圖)。TAD邊界通過粘連蛋白復合物來穩定,并且通常富含CTCF和轉座元件或看家基因;邊界對TAD行使正常功能是至關重要的。
在更高的分辨率下,Hi-C數據集已經揭示了額外層級結構的存在,例如sub-TADs,它們是較小的空間域(大約100kb),顯示出更加動態的性質和組織特異性。此外,Loop(環)位于TAD和sub-TAD中,可以在HiC熱圖中直觀識別。一些環與增強子-啟動子相互作用有關,也顯示出動態性和組織特異性。
結構變異可以誘發染色質組織結構的巨大變化,從而產生特定的特征,通過交互熱圖可以發現明顯的特征。示意圖顯示不同類型結構變異導致Hi-C熱圖變化。通過與野生型參考Hi-C熱圖進行比較(上圖),由空間鄰近變化引起的異位相互作用變得明顯(用藍色表示);基于參考基因組的Hi-C熱圖提供變異的特定信息(即刪除,重復,倒位或易位;用灰色矩形標記)以及單核苷酸分辨率的斷點位置。此外,通過將Hi-C數據映射到含有SV的基因組(下圖),可觀察到潛在的病理機制,如TAD融合(缺失),neo-TAD形成(復制)或TAD重組(倒位)。
a、在TAD內IHH基因座的增強子的復制,導致該基因表達發生組織特異性失調并與腳的多趾癥相關。
b、SOX9位點的邊界復制,導致的TAD形成,并與烹調綜合征、短指有關。
c、刪除LMNB1基因座附近的TAD邊界導致另一個TAD內部增強子調控LMNB1基因,進而導致成人發作性脫髓鞘性腦白質營養不良。
d、翻轉EPHA4基因座增強子簇,導致增強子錯誤調控WNT6,導致拇指和食指并指畸形。
e、平衡易位。MEF2C易位,將會失去調節元件,導致腦部異常和發育遲緩
TAD內部結構變異(SV)通過改變增強子的劑量效應,可能造成功能的丟失或增加。
a、野生型示意圖中基因A在發育中的大腦中表達和基因B在肢體中表達。兩個基因分別由他們自己的組織特異性的順式調控元件調控(分別為紅色和藍色,位于不同的TAD中)
b、TAD內倒位不破壞編碼基因或TAD邊界,對基因的遠程調控無重大影響,目前沒有病例報告。
c、TAD內缺失增強子元件,可導致基因B在肢體不表達。
d、TAD內部復制。調控元件復制,基因B組織特異性的肢體過度或者錯誤表達(藍色),進而導致疾病。
1)刪除和重復類型的SV。
TAD邊界結構的變化會擾亂染色質結構域和形成新的調控單元。
a、野生型示意圖中基因A在發育中的大腦中表達和基因B在肢體中表達。兩個基因分別由他們自己的組織特異性的順式調控元件調控(分別為紅色和藍色,位于不同的TAD中)。
b、邊界元間的TAD刪除能引起TAD的融合;基因B的增強子會調控基因A,導致基因A錯誤在肢體中異位表達和疾病產生。
c、TAD邊界發生復制,形成一個新的TAD。在新的TAD中點,發生復制的基因A在發生復制的B基因的增強子的控制下,在四肢中異位表達,并導致疾病發生。
d、不包括基因A的TAD邊界復制,也形成了新的TAD,但尚未發生轉錄變化。
2)倒位和易位類型的SV
b、基因B的增強子倒位,導致A基因在肢體中異位表達。同時,基因B缺乏增強子,導致基因B不表達,進而導致肢體功能的調節性喪失。
c、平衡易位。位于染色體A的基因B與位于染色體B的基因D發生易位,重組后形成了c圖中右半部分。由于基因B丟掉增強子,獲得基因D的增強子,因而導致B基因在肢體中的表達缺失,在脊髓的異位表達。易位導致的結果取決于斷點和側翼基因。易位也可能是不平衡的。
首先識別有拷貝數變異或SV變異的基因(步驟1)。如果重排是平衡的,識別可能被破壞的基因。檢查基因是否劑量敏感和/或表型相關。如果基因沒有位于重排區域或者不是劑量敏感,從Hi-C交互熱圖判斷SV位于TAD內部還是TAD邊界。根據所示原理對SV進行分類(步驟2)。識別潛在的可以驅動一個疾病基因異位表達增強子(步驟3)。如果可能的話,計算異位增強子–啟動子相互作用與基因的表達(腫瘤)或表型(先天性疾?。╆P系(步驟4)。解釋結果,如有必要,進行功能驗證。