地中海伊奧利亞群島帕納雷亞火山島玄武岩器官的觀察。
一些新發現的病毒生活在熱液噴口和其他極端環境中。鳴謝:亞曆克西斯·羅森菲爾德/蓋蒂
研究人員利用人工智能(AI)發現了70,500種科學上未知的病毒,其中許多都很奇怪,與已知的物種完全不同。使用宏基因組學來識别RNA病毒,在宏基因組學中,科學家對環境中存在的所有基因組進行采樣,而不必培養單個病毒。這種方法顯示了人工智能探索RNA病毒宇宙“暗物質”的潛力。
病毒是無處不在的微生物,它們感染動物、植物甚至細菌,然而隻有一小部分被鑒定和描述。加拿大多倫多大學的計算病毒學家Artem 說,病毒“本質上是一個無底洞”。他說,其中一些病毒可能導緻人類疾病,這意味着描述它們的特征可能有助于解釋神秘的疾病。
之前的研究使用機器學習在測序數據中尋找新病毒。發表在本周《細胞》雜志上的最新研究将這項工作向前推進了一步,并将其用于預測蛋白質結構1。
人工智能模型包含一個名為的蛋白質預測工具,由Meta(原臉書,總部位于加利福尼亞州門洛帕克)的研究人員開發。倫敦谷歌的研究人員開發了一個類似的人工智能系統,他們本周獲得了諾貝爾化學獎。
遺漏的病毒
2022年,和他的同事搜索了公共數據庫中存檔的570萬個基因組樣本,并确定了近132,000種新的RNA病毒2。其他團體也做出了類似的努力。
但是RNA病毒進化很快,所以現有的在基因組序列數據中識别RNA病毒的方法可能會漏掉許多。一種常見的方法是尋找基因組中編碼RNA複制中使用的關鍵蛋白質的一段,稱為RNA依賴的RNA聚合酶(RdRp)。但是,如果病毒中編碼這種蛋白質的序列與任何已知的序列都非常不同,研究人員就不會識别它。
中國深圳中山大學的進化生物學家石莽是這項細胞研究的合著者,他和他的同事們在公開的基因組樣本中尋找以前未被識别的病毒。
他們開發了一個名為的模型,使用支持的“”架構,并向其輸入測序和蛋白質預測數據。然後,他們訓練他們的模型識别病毒RdRps,并使用它在大部分基因組數據中找到編碼這些酶的序列——這些序列屬于病毒的證據。使用這種方法,他們鑒定了大約160,000種RNA病毒,包括一些在極端環境中發現的超長RNA病毒,如溫泉、鹽湖和空氣。其中不到一半以前從未被描述過。巴巴安說,他們發現了“在進化空間中非常遙遠的小塊RNA病毒生物多樣性”。
位于吉朗的澳大利亞聯邦科學與工業研究組織(CSIRO)疾病預防中心的進化病毒學家傑基·馬哈爾( Mahar)說:“這是一種非常有前途的擴大病毒圈的方法。她說,病毒特征将有助于研究人員了解微生物的起源以及它們如何在不同的宿主中進化。
說,擴大已知病毒庫可以更容易地發現更多相似的病毒。“突然之間,你可以看到以前看不到的東西。”
Mahar說,該小組無法确定他們所識别的病毒的宿主,這需要進一步調查。研究人員特别想知道是否有任何新病毒感染古菌,古菌是生命之樹的一個完整分支,沒有明确顯示RNA病毒會感染它。
史現在正在開發一個模型來預測這些新發現的RNA病毒的宿主。他希望這将有助于研究人員理解病毒在其環境生态位中的作用。
doi:
參考
1.侯,徐等。細胞(2024)。
文章
谷歌學術
2.埃德加,R. C .等人《自然》602,142–147(2022)。
文章
谷歌學術
3.紮耶德等人的《科學》376,156–162(2022)。
文章
谷歌學術
有話要說...