Nature:獲得類人猿的完整染色體序列
2024.06.17在一項新的研究中,一個國際研究團隊從非人靈長類動物中獲得了完整的染色體序列。這些序列揭示了不同物種 Y 染色體之間的顯著差異,顯示了快速的進化,此外還揭示了大型類人猿(great ape)基因組中以前未研究過的區(qū)域。由于這些靈長類物種是人類的近親,這些新序列可以為人類的進化提供啟示。相關(guān)研究結(jié)果于2024年5月29日在線發(fā)表在Nature期刊上,論文標題為“The complete sequence and comparative analysis of ape sex chromosomes”。
該團隊重點研究了 X 和 Y 染色體,它們在性發(fā)育和生育以及其他許多生物功能中發(fā)揮作用。他們對黑猩猩(chimpanzee)、倭黑猩猩(bonobo)、大猩猩(gorilla)、婆羅洲猩猩(Bornean orangutan)和蘇門達臘猩猩(Sumatran orangutan)五種大型類人猿,以及一種與人類親緣關(guān)系較遠的靈長類動物——合趾猿(siamang gibbon)的染色體進行了測序。
論文共同作者、美國國家衛(wèi)生研究院國家人類基因組研究所博士后Brandon Pickett說,“這些染色體序列增加了大量新信息。在此之前,只有黑猩猩的基因組序列比較完整,但即使是黑猩猩的基因組序列也有很大的空白,特別是在重復DNA區(qū)域。”
通過分析這些新序列,該團隊估計,62%到66%的X染色體和75%到82%的Y染色體由重復DNA序列組成。對科學家們來說,對這些序列進行表征更具挑戰(zhàn)性,而對重復 DNA 的研究也是近年來才有可能的,這得益于新的 DNA 測序技術(shù)和分析方法。
該團隊將類人猿染色體的序列與人類的 X 和 Y 染色體進行了比較,以了解它們的進化史。與人類的 X 和 Y 染色體一樣,大型類人猿Y 染色體的基因數(shù)量也遠遠少于 X 染色體。
該團隊還使用了一種名為 “比對(alignment)”的計算方法,這種方法可以指出染色體在進化過程中相對不變的區(qū)域,從而揭示不同的進化壓力對基因組不同部分的影響。
該團隊發(fā)現(xiàn),90% 以上的類人猿 X 染色體序列與人類 X 染色體比對得上,這表明 X 染色體在數(shù)百萬年的進化過程中保持相對不變。然而,只有14%到27%的類人猿Y染色體序列與人類Y染色體一致。
論文共同作者兼論文共同通訊作者、賓夕法尼亞州立大學教授Kateryna Makova博士說,“這些物種的 Y 染色體之間的差異程度令人非常驚訝。其中一些物種在 700 萬年前才從人類譜系中分化出來,這在進化過程中并不算長。這說明Y染色體的進化速度非常快。”
不同靈長類動物的 Y 染色體之間的一個顯著差異是它們的長度。例如,蘇門達臘猩猩的 Y 染色體是合趾猿Y 染色體長度的兩倍。DNA 重復序列的數(shù)量和類型的差異是造成染色體長度差異的部分原因。
其中的一種DNA重復序列被稱為 “回文序列(palindrome)”,即一包含反向DNA重復序列的 DNA 序列。DNA回文序列與回文語言(如 “racecar”或“kayak”)類似,其中前半部分的字母在后半部分反向重復,因此字母的前后順序是相同的。然而,DNA回文序列的長度可能超過十萬個堿基。
該團隊發(fā)現(xiàn),靈長類動物 X 和 Y 染色體上的 DNA 重複序列幾乎總是包含基因,這些基因在染色體的長度上重復了很多份。靈長類動物基因組中的大多數(shù)基因只有兩個拷貝,一對染色體上各有一個拷貝。
科學家們猜測在這些DNA回文序列上有許多基因拷貝有助于保護基因,尤其是 Y 染色體上的基因。由于每個細胞通常只有一條 Y 染色體,如果 Y 染色體上的基因受損,就沒有另一條染色體上的基因拷貝可以用作修復損傷的模板。
圖片來自Nature, 2024, doi:10.1038/s41586-024-07473-2
論文共同通訊作者、美國國家衛(wèi)生研究院國家人類基因組研究所高級研究員Adam Phillippy博士說,“DNA回文序列上的這些基因就像保留了一個備份。我們知道,這些基因中有很多都在發(fā)揮重要功能,因此我們期望在不同物種中看到相同的基因出現(xiàn)在DNA回文序列中,但情況似乎并非如此。”
該團隊對包含在DNA回文序列中的幾組基因進行了研究,其中許多基因在精子生成中發(fā)揮作用,因此對生育能力非常重要。雖然在研究的所有靈長類動物Y染色體上都發(fā)現(xiàn)了DNA回文序列,但每個物種的特定DNA回文序列和這些DNA回文序列包含的基因往往是不同的。
Phillippy博士說,“可能還有更多我們尚未發(fā)現(xiàn)的變異。在人類的 Y 染色體上,一些基因的數(shù)量會因個體差異而不同。對于其他靈長類物種,我們僅在個體水平上看到這一點。我們還不知道這個群體中的其他成員是否也是如此,也不知道我們可能會發(fā)現(xiàn)哪些其他變異。”
Makova博士補充說,“不過,我們團隊之前的研究工作已讓我們了解到一些新見解,這些見解表明,人類和其他類人猿的 Y 染色體基因拷貝數(shù)存在著廣泛的變異。”
這些類人猿染色體序列還解析了另一類稱為衛(wèi)星DNA的重復序列,其中衛(wèi)星DNA是一類片段較長的重復序列。在大型類人猿中,這些作者發(fā)現(xiàn)了幾種以前未知的物種特異性衛(wèi)星DNA序列。
這些序列為深入了解大型類人猿基因組提供了重要見解,因為衛(wèi)星DNA遍布整個基因組。具體來說,它們集中在染色體末端(稱為端粒)附近,以及另一個稱為著絲粒(centromere)的區(qū)域,其中著絲粒有助于染色體在細胞分裂過程中組織起來。在這項研究和該團隊近期開展的另一項研究工作之前,這些物種的著絲粒序列完全不為人知。
Makova博士說,“這些來自類人猿的衛(wèi)星DNA為我們開辟了新的探索領(lǐng)域,與我們對Y染色體的其他發(fā)現(xiàn)類似,我們可以看到Y(jié)染色體的著絲粒具有高度的動態(tài)性。”
這些染色體序列可以幫助科學家們研究包括人類在內(nèi)的類人猿的進化。該團隊目前正在努力描述這些類人猿物種的整個基因組,但即使單獨來看,這些X 和 Y 染色體序列也能提供很多啟示,尤其是關(guān)于 Y 染色體上的進化力量是如何促使其快速進化的。
其中一個因素是每個細胞通常只有一條Y染色體,這導致DNA序列的變化不斷累積。Makova博士說,另一種進化力量是一種稱為雄性突變偏倚(male mutation bias)的現(xiàn)象。與卵子的產(chǎn)生相比,精子的產(chǎn)生涉及更多的DNA復制。每次復制,DNA 序列都有可能發(fā)生變化。這影響到所有染色體,但對 Y 染色體的影響尤其大。
另一個潛在因素是種群規(guī)模小,這會影響進化速度。這些類人猿不僅野外種群數(shù)量有限,而且Y染色體只存在于一半的種群中,這進一步限制了基因組這一特殊部分在種群上的數(shù)量。Makova博士說,“重要的是要記住,這些類人猿物種都瀕臨滅絕。我們不僅可以從這些序列中了解人類的進化,還可以運用我們對它們的基因組和人類基因組的了解,更好地理解這些瀕危物種的生物學和繁殖。”
參考資料:
Kateryna D. Makova et al. The complete sequence and comparative analysis of ape sex chromosomes. Nature, 2024, doi:10.1038/s41586-024-07473-2.
Scientists generate the first complete chromosome sequences from non-human primates
https://www.genome.gov/news/news-release/scientists-generate-the-first-complete-chromosome-sequences-from-non-human-primates