繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

看圖追蹤蛋白,扎克伯格和妻子創立的生物中心開發AI新算法

2022-08-11 18:43

  徐詩露

  ·《自然》子刊上最新發表了一種完全自監督學習的算法,能根據蛋白質圖像,跟蹤其定位的微小變化,預測蛋白質在細胞中協同工作的方式。這可能是進一步瞭解許多疾病和促進藥物研發的關鍵。

  人工智除了學會了從圖像中識別和分類不同的狗品種(上),來自CZ Biohub的一種新的機器學習方法可以從熒光顯微鏡圖像中分辨出不同的人類蛋白質(下) 圖片來源:CZ Biohub

  人體的每個細胞大約含有10000種不同類型的蛋白質,它們支持了幾乎所有的細胞活動,堪稱身體各項機能的「小管家」。有些蛋白質單獨工作,有些則協同工作,來保證細胞的健康運轉。

  這些蛋白質可能以組合的形式,出現在細胞中的不同位置,它們究竟是怎麼協調工作的?

  7月下旬,來自陳·扎克伯格生物中心(CZ Biohub)的研究團隊開發了這種名為「Cytoself」的完全自監督的深度學習方法,可以在沒有任何先驗知識的情況下,對蛋白質的顯微鏡圖像進行定量分析和比較。

  該中心由Facebook創始人扎克伯格與妻子普莉希拉·陳共同捐資成立。

  它是怎麼做到的?

  新算法能定量分析和比較圖像中的蛋白

  幾十年來,生物學家一直在嘗試各種方法和工具,確定細胞內蛋白質所有可能的位置和結構,來幫助人類進一步瞭解蛋白質的工作方式,而Cytoself的出現讓問題的答案迅速浮出水面。

  美國陳-扎克伯格生物中心的這項研究於7月25日發表在《自然·方法》(Nature Methods)上。題為「Self-supervised deep learning encodes high-resolution features of protein subcellular localization」。

  Cytoself的算法有何與衆不同?

  簡單來説,它能夠通過機器學習中的自我監督學習,來識別蛋白質定位的多樣性和複雜性。

  研究人員在對Cytoself算法進行訓練時,並沒有選擇向算法逐一輸入單個示例,而是選擇了一種自我監督學習的訓練方案,以此來揭示出高分辨率的蛋白質亞細胞定位圖譜

  在監督學習模型中,人類必須不斷地用單個的例子來教機器人,也就是需要向算法輸入大量關於蛋白質圖像的知識,從而達到對算法的訓練效果,這個過程對於研究人員而言是繁雜且乏味的。如果機器人僅侷限於人類給它訓練的有限數目的例子,它可能會給系統帶來一定的偏差。自我監督學習卻可以規避這些缺點。

  研究人員對Cytoself算法經過學習訓練后從蛋白質圖像中提取的信息量感到驚訝。Cytoself不僅展示了機器學習算法的能力,還能給細胞以及蛋白質的研究提供新的視角。

  論文的通訊作者Loic Roye感慨道,「這非常令人興奮,我們正在將人工智能應用於一種新的問題,並且正在復現人類所知道的一切,甚至發現人類目前還不知道的。」

  另一個通訊作者Manuel D. Leonetti表示,「機器將每個蛋白質圖像轉換為數學向量,因此,研究人員可以對看起來幾乎沒有差別的蛋白質圖像進行比較。我們亦可以通過比較蛋白質的圖像來預測它們在細胞中協同工作的方式,這有點令人驚訝。」

  機器學習和高速成像專家Kobayashi則表示,「雖然此前有一些關於使用自我監督或無監督模型的蛋白質圖像的工作,但從未如此成功地將自我監督學習用於處理如此龐大的數據集,該數據集擁有超過100萬張圖像,涵蓋了人體細胞中的1300多種蛋白質。」

  值得一提的是,這100多萬張圖像來源於CZ Biohub的OpenCell數據庫。這個數據庫旨在創建人類細胞的完整圖譜,包括最終描述細胞中20000種左右的蛋白質。

  據悉,該研究團隊下一步將用Cytoself跟蹤蛋白質定位的微小變化,以識別不同的細胞狀態,如正常細胞與癌細胞,這可能是進一步瞭解許多疾病和促進藥物研發的關鍵。

  對此,Kobayashi表示,藥物研發過程中的篩選基本上需要反覆進行試驗,但是有了Cytoself算法后,科學家就不再需要用成千上萬的蛋白質逐個做實驗。這個方法可以有效降低成本,提高藥物研發的速度。

  陳·扎克伯格生物中心是什麼機構?

  Cytoself由陳·扎克伯格生物中心的科研人員發明,這家俬人研究機構到底有何來頭?

  陳·扎克伯格生物中心於2016年正式啟動,總部位於舊金山,它是一個非營利性研究中心。

  據中國科學報報道,該中心由Facebook創始人馬克·扎克伯格(Mark Zukerberg)與妻子普莉希拉·陳(Priscilla Chan)共同創立,位於美國加利福尼亞州舊金山市,是一家致力於治療、預防與控制各類疾病的非盈利研究機構。2017年初,該中心宣佈將無條件資助附近3所研究型大學里47位充滿冒險新想法的研究者。該生物中心也是「陳·扎克伯格行動」涉足科學領域的第一個實體機構,在2016年9月成立之初,扎克伯格與兒科醫生的妻子共同承諾,將在未來10年內對該中心持續投資30億美元。

  CZ Biohub主頁

  簡單來説,陳·扎克伯格生物中心支持細胞生物學中嚴謹、定量的研究,來對抗由細胞失調引起的疾病。他們還幫助人類應對現有和新型病原體的威脅。除此之外,陳·扎克伯格生物中心開源他們的工具和技術給科研同行。

  陳·扎克伯格生物中心的聯合總裁Joe DeRisi博士曾表示,「陳·扎克伯格生物中心將通過創建新的技術平臺、基礎數據庫和大規模細胞生物學管道,擴大我們在全球範圍的病原體檢測工作,在傳染病和基礎科學方面進行更加深入地研究。」

  人工智能介入生命科學研究?

  談到了Cytoself,讓我們不禁想到赫赫有名的AlphaFold。它們都是利用機器學習算法來研究蛋白質。但二者有何不同?

  AlphaFold由DeepMind公司開發,根據基因序列已預測出2億多種蛋白質結構。

AlphaFold預測出的蛋白質結構。圖:DeepMind AlphaFold預測出的蛋白質結構。圖:DeepMind

  而Cytoself是通過對蛋白質的熒光顯微鏡圖像進行定量分析和比較,可以幫助科學家預測蛋白質在細胞中協同工作的方式

  總體而言,不論是AlphaFold系統,還是Cytoself算法,它們都是人工智能(AI)與生命科學研究領域跨學科融合的成果。在未來,這種跨學科的研究方法或許會越來越多,也會給人們帶來更多驚喜和發現。

  參考資料

  1. Self-supervised deep learning encodes high-resolution features of protein subcellular localization.nature methods.

  https://www.nature.com/articles/s41592-022-01541-z

  2. AI can reveal new cell biology just by looking at images.phys.org.

  https://phys.org/news/2022-08-ai-reveal-cell-biology-images.html

  3. Home. czbiohub.

  https://www.czbiohub.org/

責任編輯:李墨軒

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。