人工智能(AI)復(fù)現(xiàn)一項諾貝爾化學(xué)獎成就,需要多久?
答案:4分鐘。這甚至比閱讀完這篇文章的時間都短。而且AI無需反復(fù)實驗,一次就成功。
這個由GPT-4驅(qū)動的“AI化學(xué)實驗室”,被命名為“Coscientist”,由來自美國卡內(nèi)基梅隆大學(xué)和翡翠云實驗室的研究團隊共同創(chuàng)建。相關(guān)研究結(jié)果發(fā)表于最新一期《自然》雜志上。
有評論稱,自此之后,人類探索化學(xué)世界的方式,可能產(chǎn)生巨大革新。
卡內(nèi)基梅隆大學(xué)的云實驗室。圖片來源:卡內(nèi)基梅隆大學(xué)
人工智能進行化學(xué)研究的概念呈現(xiàn)。圖片來源:美國國家科學(xué)基金會
AI自己學(xué)習(xí)做實驗
Coscientist結(jié)合了大型語言模型、互聯(lián)網(wǎng)和文檔搜索的能力。它首先從互聯(lián)網(wǎng)、文檔數(shù)據(jù)等來源檢索化合物的公開信息;然后通過學(xué)術(shù)期刊、維基百科、美國化學(xué)會等途徑進行學(xué)習(xí);最后根據(jù)學(xué)到的信息指導(dǎo)自己的行動,設(shè)計、規(guī)劃和執(zhí)行真實世界的化學(xué)實驗。
系統(tǒng)以GPT-4為基礎(chǔ),可通過調(diào)用4個命令(谷歌、Python、文檔和實驗)來規(guī)劃實驗。除了最后一個執(zhí)行命令外,谷歌命令負(fù)責(zé)在互聯(lián)網(wǎng)上進行搜索,Python命令負(fù)責(zé)執(zhí)行代碼,而文檔命令則負(fù)責(zé)檢索和總結(jié)必要的文檔,這些命令還可以執(zhí)行子操作。
研究團隊對Coscientist的表現(xiàn)進行了多輪測試。其中,為了檢驗它設(shè)計化學(xué)反應(yīng)流程的能力,團隊要求它通過檢索與學(xué)習(xí),分別生成阿司匹林、對乙酰氨基酚和布洛芬等藥物分子。
4分鐘做個諾獎研究
研究團隊對Coscientist的最終考驗,是讓它復(fù)現(xiàn)諾獎研究。
2010年,諾貝爾化學(xué)獎授予3位化學(xué)家,以表彰他們提出鈀催化交叉偶聯(lián)反應(yīng)。這類反應(yīng)的實用度非常高,因為其可高效構(gòu)建碳-碳鍵,輕易生成許多難以合成的物質(zhì)。在制藥領(lǐng)域,這類反應(yīng)可以在炎癥、哮喘等多類疾病的新藥開發(fā)中展現(xiàn)實力。而在電子工業(yè)、先進材料等領(lǐng)域,鈀這類反應(yīng)也能得到廣泛應(yīng)用。
Coscientist交上的答卷非常漂亮。在確定兩種反應(yīng)所需的化合物之后,它準(zhǔn)確計算了所需的劑量,并對移液機器人進行自主編程來開啟反應(yīng)。整個過程只用了不到4分鐘。結(jié)果,反應(yīng)后的透明液體樣本中成功發(fā)現(xiàn)了目標(biāo)產(chǎn)物,對樣本的分析也表明復(fù)現(xiàn)成功。
“自動化科研”即將到來
這項成果表明,人類已能有效地利用AI提高科學(xué)發(fā)現(xiàn)的速度和數(shù)量,并可改善實驗結(jié)果的可復(fù)制性和可靠性。
論文通訊作者、美國卡內(nèi)基梅隆大學(xué)研究人員蓋比·葛姆斯表示,人們可擁有自主運行的系統(tǒng),去發(fā)現(xiàn)新的現(xiàn)象、新的反應(yīng)、新的思想。而科學(xué)中的嘗試、失敗、學(xué)習(xí)和改進的迭代過程,可通過AI大大提速。這本身就將是一場巨大變革。
美國國家科學(xué)基金會化學(xué)部主任戴維·伯科威茨認(rèn)為,該團隊成功構(gòu)建了一種高效的“實驗室伙伴”。將各個組成部分巧妙地融合在一起,最終的成果遠(yuǎn)遠(yuǎn)超越了各個部分單獨的貢獻。
在同時發(fā)表的新聞與觀點文章中,葡萄牙里斯本大學(xué)藥學(xué)院阿娜·勞拉·迪亞斯和迪亞戈·羅德里吉斯認(rèn)為,Coscientist是人類朝著建立自動化實驗室邁出的關(guān)鍵一步。
不過,研究人員也指出,Coscientist尚有一些局限性。例如,它有時會出現(xiàn)化學(xué)反應(yīng)不正確的情況。但目前它可通過使用復(fù)雜的提示策略(如思維鏈和思維樹)以及增加化學(xué)數(shù)據(jù)進行自我糾正。
還需要注意的是,現(xiàn)實世界中的研究問題,很多都比這一研究中的實驗復(fù)雜得多。有些研究涉及化學(xué)以外的學(xué)科概念,如藥物開發(fā)中需應(yīng)用到的生物學(xué)。Coscientist目前還無法解決這一領(lǐng)域的復(fù)雜問題。(記者 張夢然)