(該科普視頻來自:TED-Ed,首發於WeChat:解螺旋的礦工,以下內容有刪改)
你大概已經聽說過什麼是人類基因組——它是巨量的基因總和,並且在你身體中每一個細胞裡都有一份。你很可能也知道我們已經對人類基因組進行了測序,但這到底是什麼意思?怎樣對一個人的基因組進行測序?
我們先講點背景知識。
首先,什麼是基因組?
簡單來說,基因組,就是全部的基因再加上點別的物質共同組成的一個有機體。基因由DNA組成,而DNA是成對的長鏈,由A(腺嘌呤),T(胸腺嘧啶),C(胞嘧啶)和G(鳥嘌呤)組成。
你的基因組就像是一組代碼,你的細胞需要通過它來知道自己在什麼時候該做些什麼。細胞交織在一起成為了組織,不同的組織相互協調構成了器官,而器官協同工作形成了生命體,也就是你!因此你之所以是你,很大程度上源自於你的基因組。
第一個人類基因組測序結果的真正完成時間是2003年。當時非常艱難,它花了15年才完成(視頻中是20年,這其實是有爭議的),期間有來自全世界幾十個國家和地區幾百位科學家的辛苦付出,而且費用超過30億美元。但現在卻只需要數天時間,費用不過6000人民幣。我們已經可以展望在不久的將來,只要幾分鐘時間,就能搞清組成你這個人的基因組的字母排列,費用甚至還不及一份較好的生日禮物貴。
但這要怎麼做呢?讓我來解釋一下,弄清你基因組中這幾十億個字母的排列順序,是基因測序的基本目標。基因組既很大很大,又很小很小。DNA中的每個字母,就是A、T、C、G,寬度只有8-10個原子。
而它們在細胞中全部纏繞在一起成為一團,就像一團毛線。
所以要從這麼小的地方獲取所有的這些DNA信息,科學家首先要把DNA的長鏈打斷為許多短鏈。然後把每一段分離出來單獨測序。
那麼,到底怎麼測?你這樣想一下或許會更容易理解:當DNA上彼此之間的序列剛好互補的話,這一條DNA就會和其它DNA交合:A配T,T配A,G配C,C配G。
那麼,如果兩片DNA的序列剛好能夠互補,它們就會結合在一起。但由於基因片段非常小,我們需要某些辦法來放大這些信號,這樣才能檢測到每個字母是什麼。科學家最常用的方法,是用酶來把原來的基因片段多合成出幾千份(以此將原來的信號放大幾千幾萬倍)。這樣我們就能夠採用一些技術手段進行檢測了。
經過複製之後,接下來我們要做的就是把全部的這些序列信息都讀取出來。為了做到這一點,我們需要再製作一批特別的字母,每種都有特殊的顏色。
把這些帶顏色標記的字母和酶混合在一起後,再加入到我們試圖閱讀的這個基因組裡。這樣,在化學反應的作用下,基因組上的每個位點,都有這樣一個特殊字母和對應的字母結合,從而形成一段雙鏈DNA,而且在新合成的DNA上每個字母上都帶有顏色標記。
然後,科學家們對每一小段基因組進行照相,之後,我們就可以看到一些列顏色點的排列順序,接著,我們就可以通過這些色點讀出序列了。最後,這樣幾百萬(甚至幾億)條的DNA片段會由計算機程序拼接在一起,我們就能得到這整個基因組的完整序列。
雖然這並非是獲取DNA字母順序的唯一方法,但卻是目前最常用的方法。
當然,僅僅只是讀取基因組中的字母還遠遠不夠。這就好比你在翻一本書,你雖然能讀出書裡的每一個字母,但卻不理解書裡說了什麼,這是因為書中所用的語言你並不懂。
所以,測序完成之後,下一步重要的工作就是解碼出這些序列到底是什麼意思。搞明白為什麼你的基因組會和我的不一樣。闡釋這些基因組中各個基因元件的功能,是當下科學家們正在進行的工作,雖然並不是每一處不同之處都意義重大,但這些不同之處組合(疊加)在一起,就決定了人與人之間的不同。
它決定了我們的外貌看起來怎麼樣,我們喜歡什麼,我們如何反應,甚至包括我們患上某種疾病的可能性,以及對各類藥物的不同反應。
所以,更好地認識我們各自基因組上的差別之處意義重大。同時,在認識到這些差別之後,也必將會改變我們的許多傳統觀念:不僅包括醫生應當如何治療病人,也包括我們彼此之間該如何更好相待。
閱讀更多 解螺旋的礦工 的文章