被譽為生命科學“登月計劃”的人類基因組測序再次取得重大進展:國際科學團隊端粒到端粒聯(lián)盟(T2T)發(fā)表了第一個完整的,、無間隙的人類基因組序列,,首次揭示了高度相同的節(jié)段重復基因組區(qū)域及其在人類基因組中的變異。這是對標準人類參考基因組,,即2013年發(fā)布的參考基因組序列(GRCh38)的“重大升級”,。當?shù)貢r間31日,《科學》雜志連發(fā)6篇論文報告這一成就,。
2001年2月12日,,由6國科學家共同參與的國際人類基因組計劃首次公布人類基因組圖譜及初步分析結果;2003年4月15日,,公布了人類基因組序列草圖,。然而由于技術限制,當初的人類基因組計劃留下了大約8%的“空白”間隙,。這部分很難被測序,,由高度重復、復雜的DNA塊組成,,其中包含功能基因以及位于染色體中間和末端的著絲粒和端粒,。
新的無間隙版本被稱為T2T-CHM13,由30.55億個堿基對和19969個蛋白質(zhì)編碼基因組成,。增加了近2億個堿基對的新DNA序列,,包括99個可能編碼蛋白質(zhì)的基因和其中近2000個需要進一步研究的候選基因。這些候選基因大多數(shù)是失活的,,但其中115個仍然可能表達,。團隊還在人類基因組中發(fā)現(xiàn)了大約200萬個額外的變異,其中622個出現(xiàn)在與醫(yī)學相關的基因中,。此外,,新序列還糾正了GRCh38中的數(shù)千個結構錯誤,。
具體而言,新序列填補的空白包括人類5條染色體的整個短臂,,并覆蓋了基因組中一些最復雜的區(qū)域,。其中包括在重要的染色體結構中及其周圍發(fā)現(xiàn)的高度重復的DNA序列,如染色體末端的端粒和在細胞分裂過程中協(xié)調(diào)復制染色體分離的著絲粒,。新序列還揭示了以前未被發(fā)現(xiàn)的節(jié)段重復,,即在基因組中復制的長DNA片段,已知其在進化和疾病中發(fā)揮重要作用,。
新序列還在識別和解釋遺傳變異方面具有重要改進,,并揭示了關于著絲粒周圍區(qū)域的前所未見的細節(jié),。這一區(qū)域內(nèi)的變異性可能為人類祖先如何進化提供新證據(jù),。
研究人員稱,這一完整的,、無間隙的序列對于了解人類基因組變異的全譜和了解某些疾病的遺傳貢獻至關重要,。
研究人員表示,下一階段的研究將對不同人的基因組進行測序,,以充分掌握人類基因的多樣性,、作用以及我們與近親、其它靈長類動物的關系,。(實習記者張佳欣)
【總編輯圈點】
基因組的某些區(qū)域,,其實是一遍又一遍的重復,這些重復區(qū)域包括細胞分裂中一些極其關鍵的部分,,也包括可能幫助物種適應的新基因,。在過去,所有這些重復使得科學家無法以正確的順序“組裝碎片”——就像高難度的,、幾乎每一塊都相同的拼圖,,而人們不知道其中哪一塊該放在哪,就在基因組圖譜上留下了巨大空白?,F(xiàn)在的最新成果不再有任何隱藏或未知的部分,,或者也可以說,一個全新的基因寶庫正在全人類面前徐徐打開,。