09.22 解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

地球上的生命究竟是從哪來的?是通過外太空隕石產生的?還是地球自身通過化學演化而來?雖然目前有一些關於生命的化學起源研究,但這些化學物質是如何推動生命演化得更加複雜?

生命的化學演化是一個龐大的開放性問題。而其中的一個基礎問題格外引人注目:為什麼地球上的所有生命都基於特定的 20 種氨基酸?這 20 種氨基酸一直讓科學家著迷。雖然理論上氨基酸可以有無限多種形式,但地球上整個生物界的蛋白都只由這 20 種氨基酸組成,這 20 種氨基酸還有更古怪的性質:它們都有相同的手性。而在實驗室的合成化學反應中,難以合成兩種手性分子中的特定一種對映體,而為了純化出其中一種對映體,化學家們可謂是費盡心機。

那麼,究竟為什麼是這 20 種氨基酸構成了生命?為什麼生命體中的氨基酸有 20 種,而不是 10 種或 30 種?為什麼是目前的這 20 種而不是其他的 20 種氨基酸?在過去的幾十年裡,熱心的化學家和生物學家已經開始將發現的證據拼合在一起。

非生命氨基酸與 RNA 世界

氨基酸是如何產生的?拋開外太空直接引入的部分,1952 年著名的米勒-尤里實驗在探索無機物質生成氨基酸的路上邁出了第一步。

實驗展示了在模擬閃電的電火花作用下,簡單的物質如水、甲烷、氨氣和氫氣可以形成超過 20 種不同的氨基酸。這些氨基酸也出現在隕石中。1969 年在澳大利亞發現的默奇森隕石中發現了至少 86 種氨基酸,其中包括最多有 9 個碳原子的取代基和二羧基、二氨基等不同的官能團。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 默奇森隕石(左)和隕石中發現的一些氨基酸(右)(來源:阿貢國家實驗室/Scientific Reports)

在地球誕生的最初 10 億年,其環境和麵貌與現今有著巨大的差異。在當時的地球上,溫度很高,活火山遍佈地表,時常噴發出火山灰和岩漿,大氣十分稀薄,氧氣很少,整個地球暴露在強烈的紫外線中。那時的海洋,是不同物質相互影響、形成複雜混合物的溫床,而在這裡,RNA 在生命最初的進化中扮演重要角色。

RNA 世界理論認為,地球上最早期的生命分子以 RNA 最先出現,之後才有的蛋白和 DNA。而這些早期出現的 RNA 分子,既有如 DNA 的遺傳信息存儲功能,又有如蛋白質的催化生化反應功能。在 RNA 世界階段,RNA 是支持早期生命的關鍵分子。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 地球演化歷史(來源:維基百科)

然而,氨基酸何時出現至今仍是一個謎。

遺傳物質和蛋白質之間存在嚴重的依賴關係。沒有蛋白質的參與就無法完成 DNA/RNA 的複製和組合,而如果沒有 DNA/RNA 攜帶的信息,蛋白質也無從合成。

20 種氨基酸:構成生命的字母表

從丙氨酸(A)到酪氨酸(Y),20 種構成蛋白的基本單元構成了生命的字母表。由這些氨基酸建成的蛋白大分子,是生物的主要大分子,為不同的生命體提供不同的結構和功能。

但是為什麼生物選擇通過氨基酸作為大分子的基本單元?

德國美茵茨大學氧化還原醫學專家 Bernd Moosmann 認為,這是由於氨基酸首先被用於將 RNA 結構錨定在膜上。“你也可以在現代生物中發現這種現象:細菌和線粒體的 DNA 和 RNA 分子通常在膜內部與膜接觸。”多數研究者認為,這一現象在 40 億年前的“RNA 世界”中就存在,當時 RNA 分子是最先可以自我複製的分子,因此也擔任類似現今蛋白的催化功能。”

縱觀 20 種氨基酸,不難發現這些氨基酸性質非常多樣:它們涵蓋了從酸性到鹼性、從疏水到親水等不同理化性質。

但這一組氨基酸最終出現在生命體中,究竟是巧合,還是經歷漫長進化最終確定的呢?

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 氨基酸遍佈不同理化性質範圍(來源:COMPOUND iNTEREST)

來自嚴格篩選,還是冰凍事件?

雖然我們無法判斷在隕石中出現的幾十種氨基酸是否與其他星球存在生命有關,但氨基酸是一個龐大的家族,其側鏈可出現成千上萬種不同的變化。那麼,為什麼地球上的生命體中只出現了這 20 種氨基酸?

一些人們傾向於認為,這 20 種氨基酸只是隨機選出的,如英國生物學家 Francis Crick 在 1960 年提出的“冰凍事件理論”。該理論認為,另外不同的 20 種氨基酸也可以和現今生命體中的 20 種氨基酸具有同樣效果。

英國曼徹斯特大學化學生物學家 Andrew Doig 在進行阿爾茨海默病研究時想到了化學物質的進化。他對這個問題有不同的看法:“這些構成蛋白的氨基酸在 RNA 世界時被選出,那時生命和代謝已經存在了上百萬年,產生了大量不同的有機分子。”如果氨基酸是 RNA 代謝的結果,這將大大提高氨基酸在環境中的濃度。

Doig 閱讀了關於冰凍事件理論的論文,但他認為這其中還存在一些問題。這促使他將新想法寫成了一篇最近發表的論文。文中他論述了每一種氨基酸都是經過選擇的,這導致了現今生物體中的 20 種氨基酸是一組理想的組合。選擇中的考慮因素包括每一種氨基酸的組成原子、官能團和生物合成成本。

對生物學中 20 種氨基酸的選擇,明顯與蛋白的發展有關。通過將不同的氨基酸縮合生成多肽鏈,蛋白可摺疊成可溶結構,具有緊密的核心以及有特定結構的結合腔。蛋白的形成以及最終採用了 20 種氨基酸作為標準可能是一個重大的進化步驟。

Doig 解釋說,形成可溶的穩定蛋白結構,並擁有緊密的核心與特定結構的結合腔需要不同氨基酸種類。這就需要多種疏水蛋白。“蛋白的核心是一個 3D 拼圖,如果你有不同類型的疏水氨基酸,你就有更多建造無縫核心的選擇。”

疏水氨基酸傾向於有更多支鏈的側鏈也獲得瞭解釋。在蛋白核心,分子不再需要轉動並失去一些相關的熵。“如果你有更多支鏈的氨基酸如纈氨酸、亮氨酸和異亮氨酸,你就可以在將它們整合在一起時損失更少的熵。因此進化選擇出的這些疏水氨基酸並不僅僅是因為它們的疏水性,同時還由於它們有支鏈,”Doig 說,“如果你想要氨基酸構成蛋白的核心,你必須選擇疏水和有支鏈的氨基酸,而如果你想構成蛋白的表面,那麼你需要一些直鏈和極性的氨基酸如精氨酸和穀氨酸。”

但根據 Doig 的說法,這些都還只是猜測。“我們根本沒有直接的證據。”我們從目前的比較基因組中所知道的是,在 35 到 38 億年前我們的共同祖先就已經在使用這 20 種氨基酸了。

美國馬里蘭大學天體生物學家 Stephen Freeland 提出了一種方法,可以證明生物學中的氨基酸並不是隨機選出的。他將藥物發現所用到的化學空間借用過來。在化學空間中,不同的分子被放在一個 3D 空間中,用以幫助發現可能作為新藥物的空白。Freeland 和他的團隊所考慮的 3 個參數分別是分子大小、電性和疏水性。“這個空間雖然並不完美,”Freeland 說,“但是在解釋這些氨基酸可以做到什麼和為什麼它們能夠做到這些功能,這個 3D 空間已經很能說明問題了。”疏水性在蛋白摺疊過程中明顯扮演了重要角色,電性對化學反應和活性位點十分重要,而分子大小則十分直觀的反應在蛋白結構上。

“我們發現了生物學中氨基酸分佈具有明顯的非隨機特徵,”Freeland 說。這些氨基酸很好的分佈在整個化學空間中,同時顯示出在空間中分佈的均勻性——就好像在嘗試儘可能覆蓋不同的特性。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 新加入的氨基酸擴展了原先氨基酸的空間(來源:Journal of Systems Chemistry

所以,如果目前這組氨基酸並非隨機出現,而是充分選擇出來的,那麼是否有可能找到這些氨基酸進入生物的順序?“目前有一項共識,這些氨基酸並不是所有都同時進入生物界,我認為這一觀點目前是壓倒性的,”Freeland 說。而以色列海法大學進化研究所的分子生物物理學家 Edward Trifonov 則嘗試找出這些氨基酸完整的順序。Trifonov 在 21 世紀 00 年代早期發現的多種 DNA 的新型編碼引起了他對氨基酸的興趣和注意。

很明顯的是,最簡單的氨基酸應出現得最早,但 Trifonov 更進一步。他研究了多種條件,包括合成的能量成本,搬運氨基酸的轉運 RNA 分子類型以及用於蛋白合成的密碼子的數量,密碼子是指與某一氨基酸對應的 3 個 RNA 核苷酸序列。他認為,那些有多個密碼子對應的氨基酸很可能比只有一個密碼子的氨基酸要更早出現在生命中。他還對數據進行了平均,並提出了一個從丙氨酸和甘氨酸開始的時間順序。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | Trifonov 推測的密碼子年代表(來源:Journal of Biomolecular Structure and Dynamics

Freeland 也研究了氨基酸適應早期環境和後來環境的不同模式的變化。他發現在最開始的 10 個氨基酸構成的化學空間就已經體現出非隨機的性質,這與隕石或米勒-尤里實驗中非生命氨基酸形成對比。然後,他將完整的 20 個氨基酸加入了化學空間,“後續進入生命的氨基酸通過加大化學性質範圍和分佈均勻性,擴大了早期的化學空間,而最有趣的是,它們似乎填充了原本較為空曠的區域,即在早期氨基酸和早期二聚體之間的位置,”他說,“這能講得通,因為這正是需要填充的地方。”

大氧化事件擴展了氨基酸密碼

我們知道,蛋白也可以由更少類型的氨基酸構成。日本早稻田大學赤沼哲史團隊最近展示了由 13 種氨基酸構成的摺疊的、可溶的、穩定具有催化活性的“蛋白質”,雖然新蛋白並沒有它的母蛋白那麼高活性和穩定性。所以,新增加的氨基酸可能對蛋白性質有哪些提高?Moosmann 認為,氧分子驅動新的 6 種氨基酸進入生命。

這最後 6 種氨基酸(組氨酸,苯丙氨酸,半胱氨酸,蛋氨酸,色氨酸和酪氨酸)的化學性質更“軟”——這些氨基酸強烈的可極化並以共價鍵結合。“它們更具有適應性,這不只是巧合。”Moosmann 說。這一想法在 Moosmann 對小鼠大腦組織的研究時出現,Moosmann 的研究涉及神經退行性疾病。他注意到,一些氨基酸更容易發生氧化降解。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 大氧化事件後新加入的 6 種氨基酸化學性質更“軟”(來源:PNAS

如果這些氨基酸是由於氧化還原活性進入生命的,那麼 Moosmann 預感,這些適應性與地球上氧分子水平的增加有關。氧氣目前已經被認為是地球環境的一部分,這是因為在大約 25 億年前,地球曾出現一次“大氧化事件”,而最初生命起源於低氧化環境,因而那些能夠在低氧環境形成的產物可能出現得更早。基於最近對光合作用酶進化的研究,英國倫敦帝國理工學院的 Tanai Cardona 認為,合成光合作用合成氧的起源可追溯到 36 億年前。

隨後他決定進一步探究生物氨基酸中,最高佔據分子軌道(Homo)和最低未佔分子軌道(Lumo)之間的能帶隙。這些能帶隙能夠預測化合物電子轉移的反應活性。這些氨基酸的能帶隙共有相似的模式,而在對氧的新適應性特徵出現後,也就是第 14 種氨基酸出現以後,這一模式被打破,這很可能不只是一個巧合!”

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 不同氨基酸的能帶隙(來源:

PNAS

新出現的氨基酸更小的能帶隙表明,它們的基礎功能是適應氧化還原反應。Moosmann 認為,這是在具有氧自由基的環境中所需要的,新環境對脂質具有破壞性。而更“軟”的氧化還原活性氨基酸可以保護細胞:“這些新的氨基酸類型可以在更高氧濃度環境、或傾向於攻擊和降解不飽和脂肪酸的環境中,用來維持磷脂雙分子層的完整性。”Moosmann 說。“對於甲硫氨酸、色氨酸和酪氨酸來說,我們有壓倒性的證據證明它們與應對氧環境有關。”

然而這又引起了另一個問題:是否我們最後的共同祖先已經在用和我們現代生物一樣的整套氨基酸?一項 2016 年的研究鑑定了 355 個基因,這些基因被認為存在於名為 Luca 的生物體中。Moosmann 說,Luca 可追溯至 37 到 29 億年前,所以很可能氧已經存在。“這項研究的結果也確實發現,Luca 有少於 20 個氨基酸。”他認為更晚的基因編碼加入了之後所有的現代生物支線:“我猜測,Luca 有 17-18 種氨基酸,缺少甲硫氨酸、色氨酸,可能還有酪氨酸。”

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | LUCA 基因的系統發育樹(來源:Nature Microbiology

到此為止,還是會繼續擴展?

對氧環境的適應或許能夠對氨基酸種類的擴展進行解釋,但為什麼停在了 20 種氨基酸的情況?Freeland 說,“很明顯,20 種氨基酸已經足夠適應整個生命週期的不同環境。”

事實上,生物體中至少還有更多的 2 種氨基酸,雖然在人類蛋白中只發現了其中的一種,即硒代半胱氨酸。這種氨基酸出現在 25 種人類蛋白的活性位點上。“這體現出氨基酸演化還在繼續,但以目前的情況,或許新氨基酸的加入過程會十分困難,”西班牙巴塞羅那生物醫學研究所的分子生物學家 Lluis Ribas 說,“如果新氨基酸想要加入,那麼必須通過非常原始的途徑。”

Riblas 進一步觀察了蛋白合成的機制,即氨基酸的轉運過程。這一過程在細胞的核糖體上發生,核糖體由非常複雜的 RNA 和蛋白分子構成。每一個氨基酸由一個特定的轉運 RNA(tRNA)分子攜帶,通過羥基形成酯,後與新形成的蛋白鏈進行反應。正確的氨基酸順序由信使 RNA 分子翻譯,信使 RNA 可與 tRNA 分子鹼基配對。每一個 tRNA 都含有 3 個鹼基,這 3 個鹼基就是密碼子,會對應 20 種氨基酸中的一種。

考慮到每個氨基酸由 3 個鹼基序列編碼,你可能會猜想這一共有 64 種可能的組合(每一個鹼基有 4 種可能)。即便是有 3 個終止密碼子指導蛋白合成的停止,仍有 61 種可能的組合。那麼為什麼會停留在 20 種氨基酸呢?“這一限制來源於 tRNA 對氨基酸的識別能力。”Ribas 說。每一種 tRNA 分子都有特殊的三級結構被用來識別氨酰-tRNA 合成酶,這種酶可以將正確的氨基酸與 tRNA 連在一起。通過研究 tRNA 的結構,Ribas 發現想要有新的氨基酸加入,就必須合成可以識別新氨基酸而不會錯誤識別成已有氨基酸的 tRNA 分子,同時需要與已有蛋白翻譯機制相融合,因此這樣的結構很有限。

解密“標準遺傳密碼”:為什麼是這20種氨基酸構成生命?

圖 | 氨基酸密碼子(來源:SigmaAldrich)

“這就像你有一個非常簡單的鎖,只能更改 3 到 4 個齒。目前已經無法作出新的鑰匙了,因為新鑰匙會打開已有的鎖。”他解釋道。也就是說,目前已經無法創造出新的 tRNA,這種 RNA 不會被錯誤的識別。在現代生物學中,大多數氨基酸可通過多於 1 種密碼子編碼——這也幫助提高了翻譯的準確性(氨基酸錯誤結合發生的概率約為 1000 到 10000 次分之一。)

擴展氨基酸密碼,是否能重新書寫生命?

Ribas 說他的工作同時也對合成生物學家有意義,這些合成生物學家嘗試進一步對遺傳密碼進行擴展,加入非天然氨基酸。2011 年,包括哈佛大學合成生物學家 George Church 團隊的研究成功移除了大腸桿菌三個終止密碼子中的一個,這就允許他們將非天然氨基酸取代原先終止密碼子的位置。

但 Ribas 不確定合成生物學家的這項策略是成功的。“如果你嘗試建造體內系統創造含有非天然氨基酸的蛋白,這並不是一種高效的做法,通常將會出現一些特殊的問題,”他說。而 Ribas 則希望創造出新的能符合現有蛋白翻譯機制的 tRNA 分子。“我不認為除了對整個機制進行改造,還有別的方式。”雖然目前已經有一些其他的方式出現。

即使這些方式是可能的,Freeland 也認為這並不會有什麼好處。“進化理論告訴我們,現在我們有的這套氨基酸包含了一切可能的微觀世界。”是否擴展生命的氨基酸字母表或許有待進一步應用研究,但目前已有大量證據證明,生命的 20 種氨基酸是被選擇出來的,而不是“冰凍事件”。

但 Freeland 對看起來像是按順序進行化學演化的想法表示擔憂和反對。或許這種演化曾經十分混亂,涉及許多不同類型的分子機制。“從無到有的方式看起來很誘人,因為這是化學家嘗試進行反應時會按照這種情況。但這並不是宇宙中發生的事情,宇宙中充滿了凌亂的化學反應。”


分享到:


相關文章: