科學家歷 19 年終成功 完成人類全基因組最後 8% 拼圖
2003 年,人類基因組計劃公佈已對 92% 的人類基因組進行了測序,創造了歷史。但此後近二十年來,科學家們一直在努力破譯剩下的 8% 。上周刊於《科學》的研究則正式宣佈,首次完成排序 100% 人類基因組。
研究負責人、華盛頓大學 Howard Hughes 醫學研究所研究員 Evan Eichler 指出,擁有這些完整基因訊息將使人類能夠更了解我們作為個體有機體是如何形成,以及我們不僅在其他人類之間,甚至是其他物種之間如何變化。
是次研究比先前測序的基因組多 4 億個核酸序列字母,數量相當於整條染色體。這個擁有 30.55 億個鹼基對的完整人類基因組將使學界能夠分析人與人之間的 DNA 差異,以及這些遺傳變異是否會在疾病中起作用。
團隊指出,新排序出的 DNA 序列對於人類適應環境能力非常重要,當中包括免疫反應基因,幫助我們適應感染、瘟疫和病毒,使個體可存活下來,同時有預測藥物反應方面非常重要的基因。
正確排序如砌砌圖
由於其複雜性,是次剩下的 8% 人類基因組多年來一直困擾著科學家,因為當中含有多次重複的 DNA 區域,令只用以前的測序方法正確排序出 DNA 序列並串連起來具有挑戰性。
團隊依靠過去十年出現的兩種 DNA 測序技術使該項目取得了是次重要成果。第一種是牛津納米孔 DNA 測序方法,此法可一次對多達 100 萬個 DNA 字母進行測序,但會出現一些錯誤,以及 PacBio HiFi DNA 測序,此法則雖只可讀取 20,000 個字母,但準確率達到 99.9% 。
Eichler 表示,對 DNA 進行排序就像砌砌圖一樣,必須首先將 DNA 序列分解成更小的節段,然後使用測序儀器以正確的順序將之拼湊在一起,而過去的測序工具一次只能對一小部分 DNA 進行測序。
對於 10,000 塊、外貌很相似的拼圖,人很難將之快速正確砌好,情況就如測序這些重複 DNA 小段;但如果是同一圖象但只有 500 塊的拼圖,要砌好就容易得多,這就是研究所做的事,用較長的 DNA 片段進行確認。
標準的人類細胞包含兩組 DNA 副本,一個來先父親,一個則來自母親,但團隊使用的 DNA 來自一組稱為完整葡萄胎 (hydatidiform mole) 的細胞,其中只包含一組來自父或母系的 DNA 副本。
團隊另一挑戰是尋找僅包含一個基因組的細胞。
完全性葡萄胎是一種罕見的妊娠併發症,由源自胎盤的細胞異常生長引起。利用此些細胞可以簡化基因組抽取與測序的程序,他們只需要測序一組而不是兩組 DNA 。
不過,由於團隊使用了一組重複的 DNA ,最初無法對 Y 染色體進行測序。
根據是次研究領導作者、美國國家人類基因組研究所基因訊息部負責人 Adam Phillippy 說法,團隊已經成功地使用一組不同的細胞對 Y 染色體進行測序,而聖克魯斯大學基因組數據庫上提供了一套完整的 24 條已測序染色體。
解碼基因組序列代價很高。 Phillippy 指出單是此研究已總共花費了至少幾百萬美元,但這只是人類基因組計劃在 2003 年完成最終測序中所花費的約 4.5 億美元中極小部分。他表明,隨著新技術的出現,測序成本只會越來越低。
目前,對每個人而言,對自己的基因組進行測序仍然過於昂貴和耗時。不過已有團隊開始使用這個人類完整基因組,來確定某些遺傳差異是否與特定癌症有關,讓醫生更能制定合適的治療方案。
Phillippy 則希望在未來 10 年內,對個人基因組進行測序可以成為一項成本低於 1,000 美元的常規醫學測試,團隊會繼續朝著這個目標努力。
來源:CNN
報告:
Nurk, S., Koren, S., Rhie, A. & et al. (2022). The complete sequence of a human genome. Science Vol 376, Issue 6588, pp45-53. doi: 10.1126/science.abj6987
文/AC