-
首次成功從零生成原始蛋白質(zhì),AI做到了
科學(xué)家創(chuàng)建了一個能夠從頭開始生成人造酶的人工智能(AI)系統(tǒng)。在實驗室測試中,盡管人工生成的氨基酸序列與任何已知的天然蛋白質(zhì)存在顯著差異,但其中一些酶與自然界中發(fā)現(xiàn)的酶一樣有效。相關(guān)研究成果1月26日發(fā)表于《自然-生物技術(shù)》。
圖片來源:IAN C. HAYDON
該實驗表明,雖然自然語言處理是為讀寫語言文本開發(fā)的,但至少可以學(xué)習(xí)一些生物學(xué)的基本原理。Salesforce Research公司開發(fā)了名為ProGen的AI程序,使用下一代標(biāo)記預(yù)測將氨基酸序列組裝成人造蛋白質(zhì)。
科學(xué)家表示,這項新技術(shù)可能比獲得諾貝爾獎的蛋白質(zhì)設(shè)計技術(shù)——定向進化更為強大,它將加速新蛋白質(zhì)的開發(fā),為已有50年歷史的蛋白質(zhì)工程領(lǐng)域注入活力。這些新蛋白質(zhì)幾乎可以用于從疾病治療到降解塑料的任何領(lǐng)域。
“人工設(shè)計的性能比受進化過程啟發(fā)的設(shè)計表現(xiàn)得更好?!痹撗芯孔髡咧?、美國加州大學(xué)舊金山分校藥學(xué)院生物工程和治療科學(xué)教授James Fraser表示,語言模型正在學(xué)習(xí)進化的各個方面,但它不同于正常的進化過程。“我們現(xiàn)在能夠針對特定效果調(diào)整這些屬性的生成,例如非常耐熱或喜歡酸性環(huán)境,不會與其他蛋白質(zhì)相互作用的酶?!?
為了創(chuàng)建這個模型,科學(xué)家只需將2.8億種不同蛋白質(zhì)的氨基酸序列輸入機器學(xué)習(xí)模型,并讓它在幾周內(nèi)消化信息。然后,他們使用來自5個溶菌酶家族的56000個序列,以及有關(guān)這些蛋白質(zhì)的上下文信息對模型進行微調(diào)。
該模型迅速生成了100萬個序列。研究團隊根據(jù)它們與天然蛋白質(zhì)序列的相似程度,以及AI蛋白質(zhì)的潛在氨基酸“語法”和“語義”的自然程度,選擇了100個序列進行測試。
在第一批由Tierra生物科學(xué)公司體外篩選的100種蛋白質(zhì)中,該團隊制作了5種人工蛋白質(zhì)用于細胞測試,并將其活性與雞蛋清中發(fā)現(xiàn)的一種酶(雞蛋清溶菌酶,HEWL)進行了比較。在人類的眼淚、唾液和牛奶中也發(fā)現(xiàn)了類似的溶菌酶,它們可以抵御細菌和真菌。
其中兩種人工酶能夠分解細菌的細胞壁,其活性與HEWL相當(dāng)。但它們的序列只有約18%相同,這兩個序列與任何已知蛋白質(zhì)的相似性分別為90%和70%。
天然蛋白質(zhì)中的一個突變就能使其停止工作。但在另一輪篩選中,研究小組發(fā)現(xiàn),即使只有31.4%的序列與任何已知的天然蛋白質(zhì)相似,AI生成的酶仍顯示出活性。
AI甚至能夠通過研究原始序列數(shù)據(jù)了解酶如何形成。X射線晶體學(xué)測量顯示,人造蛋白質(zhì)的原子結(jié)構(gòu)看起來和它們應(yīng)該有的樣子一樣,盡管這些序列是前所未有的。
2020年,Salesforce Research基于研究人員最初開發(fā)用于生成英語文本的一種自然語言編程開發(fā)了ProGen。他們從之前的工作了解到,人工智能系統(tǒng)可以自學(xué)語法和單詞的含義,以及其他使寫作井井有條的基本規(guī)則。
“當(dāng)你用大量數(shù)據(jù)訓(xùn)練基于序列的模型時,它們在學(xué)習(xí)結(jié)構(gòu)和規(guī)則方面確實非常強大,能夠了解哪些詞可以同時出現(xiàn),以及組合性。”該研究通訊作者之一、Salesforce Research人工智能研究主管Nikhil Naik說。
對于蛋白質(zhì),設(shè)計選擇幾乎是無限的。溶菌酶和蛋白質(zhì)一樣小,最多約有300個氨基酸。但是有20種可能的氨基酸,這樣就有20300種可能的組合。鑒于無限的可能性,該模型能夠如此輕松地產(chǎn)生酶是非常了不起的。
該研究第一作者、Profluent Bio創(chuàng)始人Ali Madani說:“從頭開始生成功能性蛋白質(zhì)的能力表明,我們正在進入蛋白質(zhì)設(shè)計的新時代。對于蛋白質(zhì)工程師來說,這是可用的多功能新工具,我們期待看到它的治療應(yīng)用?!?
(作者 辛雨)
- 原標(biāo)題:AI首次成功從零生成原始蛋白質(zhì)
- 責(zé)任編輯: 房佶宜 
-
量子通信網(wǎng)絡(luò)更近一步!我國科學(xué)家實現(xiàn)模式匹配量子密鑰分發(fā)
2023-02-05 11:11 -
“中山大學(xué)極地”號順利完成渤海冰區(qū)試航
2023-02-04 07:22 中國精造 -
疫情三年,科學(xué)主義輸了?技術(shù)進步了嗎?
2023-02-03 07:19 -
西工大翼身融合大型客機縮比試驗機試飛成功
2023-02-02 09:18 航空航天 -
“悟空”即將問世,國內(nèi)首條量子芯片生產(chǎn)線亮相
2023-02-01 13:44 科技前沿 -
WHO:新冠疫情仍是“國際關(guān)注的突發(fā)公共衛(wèi)生事件”
2023-01-30 19:43 抗疫進行時 -
第二屆“天宮畫展”:航天員展示錢學(xué)森像
2023-01-21 13:41 航空航天 -
兔年送祝福 玉兔二號照片上新了!
2023-01-21 13:07 節(jié)日談 -
2022中國生命科學(xué)十大進展:新冠突變免疫逃逸機制入選
2023-01-20 10:15 -
我國科學(xué)家新發(fā)現(xiàn)挑戰(zhàn)天文學(xué)經(jīng)典理論
2023-01-19 06:47 天文 -
國際研究團隊用激光成功引導(dǎo)閃電放電
2023-01-18 09:41 -
韋布望遠鏡首次發(fā)現(xiàn)系外行星:41光年外,直徑為地球99%
2023-01-16 08:27 -
中國香港航天科技集團將與吉布提合作建太空港
2023-01-14 10:02 航空航天 -
外媒稱中國疫苗與輝瑞比效果不佳,中方駁斥
2023-01-13 16:15 中國外交 -
-
英特爾推出多次延期的處理器,中國“五朵云”到場支持
2023-01-12 23:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
“芯片卡脖子要緊,軟件卡脖子一樣要緊”
2023-01-11 15:29 觀網(wǎng)財經(jīng)-科創(chuàng) -
我國空間新技術(shù)試驗衛(wèi)星第二批科學(xué)與技術(shù)成果發(fā)布
2023-01-11 14:19 航空航天 -
“最薄”非線性量子光源首次實現(xiàn)
2023-01-10 07:45 科技前沿 -
“人造太陽”基礎(chǔ)物理研究取得新進展
2023-01-07 07:38 能源戰(zhàn)略
相關(guān)推薦 -
最新聞 Hot
-
全球股市巨震,特朗普放狠話:打到清零逆差為止
-
美媒緊盯:中國,60天了…
-
美部長:百萬美國工人將“擰著小螺絲”造iPhone…
-
馬斯克嘲諷“哈佛經(jīng)濟學(xué)博士”,納瓦羅回懟:他就是個賣車的
-
華爾街鐵粉變臉:特朗普,收手吧!
-
馬來西亞總理領(lǐng)頭:東盟要“抱團”
-
美“對等關(guān)稅”沒提俄羅斯,白宮回應(yīng)
-
“歐洲200歐元,非洲才3美元,我們正面臨‘碳掠奪’”
-
美財長試圖安撫:股市短期波動,別慌
-
“最好的反擊就是不反擊?中國是個罕見的例外”
-
一開盤,澳大利亞、新西蘭、韓國、新加坡也都崩了
-
勒龐呼吁支持者:效仿馬丁·路德·金
-
美股暴跌,美財長:怪DeepSeek…
-
“特朗普這么做就是干涉法國事務(wù)”
-
“媽媽,原諒我,這是我選擇的道路,為了幫助別人”
-
“美國救援人員剛到緬甸,就收到了解雇通知”
-