囯产精品一品二区三区的使用体验_久久老子午夜精品无码怎么打_超碰免费个人观看_粉嫩人妻91精品蜜芽在线_无码成人aaaaa毛片

首頁 > 快訊 > 正文

每日速訊:浙江大學藥學院謝昌諭:AI 模型缺乏泛化能力,制藥仍需在傳統(tǒng)計算框架之下

2023-05-09 17:36:11 來源:雷鋒網(wǎng)

" 數(shù)據(jù)共享對藥企模型的提升有一些幫助,但并不像大家預測中的那么大,有很多算法的細節(jié)仍有待突破,比如不同藥企的數(shù)據(jù)存在不一致性等問題。"

近日,雷峰網(wǎng)《醫(yī)健 AI 掘金志》推出《AI 制藥十人談》系列,探究 AI 制藥的前景與隱憂。


【資料圖】

浙江大學藥學院教授謝昌諭在與《醫(yī)健 AI 掘金志》的對話中,提到了歐洲的藥企數(shù)據(jù)共享項目 MELLODDY,指出數(shù)據(jù)共享這一模式發(fā)展中存在的局限性。

謝昌諭與 AI 制藥結緣要追溯到 2018 年。

謝昌諭是具有量子物理與人工智能雙重背景的學者,早年間曾在麻省理工學院、多倫多大學、新加坡 - 麻省理工科研中心從事理論化學、量子計算、人工智能技術在 AIDD、有機材料、生物傳感器等方向的應用研究。

2018 年回國后,謝昌諭加入騰訊量子實驗室,帶領團隊探索適合于量子計算技術的落地方向,從而進入 AI 制藥領域。

"(制藥領域)如果想要在近期內(nèi)看到比較大的研究成果,其實更依賴于傳統(tǒng)計算和人工智能,而非量子計算。"

隨著研究的深入,謝昌諭的心態(tài)也從開始的 " 將藥物設計作為實現(xiàn)‘ AI+ 量子’計算算法的跳板 ",轉變?yōu)檎嬲胍谒幬镌O計領域做出一些成果。

在浙江大學藥學院教授侯廷軍的介紹下,謝昌諭加入浙大藥學院。

對于更適用于 AI 制藥的傳統(tǒng)計算與人工智能兩種方法,謝昌諭也直言其各自的利弊:

傳統(tǒng)算法具備明確的理論,其泛化能力更強,適用范圍更廣,但計算速度卻不夠快;而 AI 模型目前還是難以真正學到底層的因果關系,模型的泛化能力較差。

" 如果對黑盒算法進行更多可解釋性的分析,將其與 AI 模型相結合,或許會成為未來的主要發(fā)展趨勢之一。"

以下為《醫(yī)健 AI 掘金志》與謝昌諭的對話內(nèi)容,《醫(yī)健 AI 掘金志》做了不改變原意的編輯與整理。

雷峰網(wǎng):您早年間的學術方向偏向量子計算、人工智能等領域,是什么時候開始轉向 AI 制藥相關研究的?

謝昌諭:2018 年加入騰訊之前,我的研究背景更偏向理論化學、量子計算、量子物理這方面,2019 年開始涉獵 AI 的方向,那時是從團隊的角度考慮,要尋找一個量子計算的落地方向。

我認為從量子計算的硬件等各方面條件來看,短期落地其實比較困難,所以想嘗試一下 "AI+ 量子 " 這兩種前沿的計算技術的結合,在一些特殊的領域中有哪些可能性,從而使量子計算技術盡快落地應用,讓社會受益于這些前沿技術。

在這個過程中,我們調(diào)研了不同的行業(yè),綜合考量每個行業(yè)的特質(zhì),以及這些行業(yè)能夠為社會產(chǎn)生的價值,還有我們團隊成員的學術背景等因素,最后覺得制藥是一個不錯的選擇。

而且根據(jù)觀察,很多跨國藥企對人工智能、量子計算、自動化、計算化學等各種技術興趣非常濃厚,一些公司在這上面的投入也很可觀。從這個角度來看,制藥也是一個很好的方向。

我們對這項研究原本的期待是,既能進行 "AI+ 量子 " 的技術研究,同時也能獲得藥企的認可,對藥物研發(fā)做出一些貢獻。

但是進行更加深入的研究之后,我們發(fā)現(xiàn),如果想要在一定時間內(nèi)看到比較大的研究成果,其實更依賴于傳統(tǒng)計算和人工智能,而非量子計算。

因此,從 2019 年開始,AI 制藥就逐漸變成我花費精力最多的一個研究方向。

雷峰網(wǎng):2022 年,您離開騰訊量子實驗室,加入浙江大學藥學院擔任教授,當時有什么契機使您決定回歸學術界?

謝昌諭:騰訊量子實驗室提供的科研環(huán)境非常好,招聘了很優(yōu)秀的研究員,進行了很多領域的交叉研究,從科研上講很有成就感。

但騰訊量子實驗室的核心目標是最大程度推動量子計算技術的發(fā)展,我一開始的想法也是想要將藥物研發(fā)作為一個出口,讓量子計算在其中發(fā)揮作用。

隨著我在 AI 制藥上投入的時間越來越多,對這個領域有了更深刻的領悟,再加上新冠疫情的影響,我的心態(tài)發(fā)生了一些改變,從最初的將藥物設計作為實現(xiàn) "AI+ 量子 " 計算算法的跳板,轉變?yōu)檎嬲胍谒幬镌O計領域做出一些成果,反而不再介意使用的方法是傳統(tǒng)的計算物理還是 AI、量子。

我的想法發(fā)生變化之后,就希望在研究上能夠以藥物研發(fā)為中心,獲得更多這方面的資源支持,恰好之前和浙江大學藥學院的侯廷軍教授有合作,通過他的介紹來到浙大藥學院工作。

雷峰網(wǎng):不久前,碳硅智慧發(fā)布了 AI 新藥研發(fā)平臺 DrugFlow1.0,作為碳硅智慧算法科學家,您在 DrugFlow1.0 的設計、研發(fā)、后續(xù)商業(yè)探索上主要參與了哪些工作?

謝昌諭:現(xiàn)階段在碳硅智慧的工作中,我希望技術層面取得一些突破,聚焦小分子藥物設計方面的前沿算法,或是在理論層面的更多嘗試。

比如在設計大模型的過程中如何更好地學習分子表征,如何更好地結合傳統(tǒng)計算物理和深度學習來實現(xiàn)一些更具理論支撐的藥物設計方案等,這些工作是更偏研究與探索性質(zhì)為主。

這也是我選擇碳硅智慧的主要原因,在研究上,我能夠去嘗試一些對藥物設計可能更有價值的理論和想法,找到其中能夠走得更遠的可行方案;

在落地上,碳硅智慧有專業(yè)的團隊和豐富的經(jīng)驗,能夠在算法和模型的技術細節(jié)上做更多的優(yōu)化,工程化的實現(xiàn)也更加專業(yè)。

雷峰網(wǎng):在 AI 制藥領域,傳統(tǒng)算法與人工智能算法分別有何利弊?如何相互結合?

謝昌諭:傳統(tǒng)算法中比較有代表性的如分子動力學模擬與結合自由能的計算,其優(yōu)勢在于具有比較明確的理論,我們就可以從理論的角度來判斷這個算法在什么場景中是相對可靠的。

同時,這些算法的泛化能力較強,適用范圍會更廣一些。

傳統(tǒng)算法也存在一些問題,比如需要使用者具備更多的專業(yè)知識儲備與實際操作的經(jīng)驗積累,才能對算法進行研究。即便是使用相關軟件,也需要較高的知識門檻。

另一個痛點則是,傳統(tǒng)算法雖然理論清晰,但計算速度不夠快,有時由于各種假設與近似的原因還是不夠精準,所以在藥物篩選的過程中實用價值比較有限。

相比之下,AI 模型如果有合適的數(shù)據(jù)進行訓練,速度會快上很多。在一些測試場景中,AI 模型的效果非常精準,但是往往到了真實的藥物研發(fā)場景中,大家就會發(fā)現(xiàn)它使用起來沒有很多科研論文里描述的效果那么好。

主要原因是 AI 模型沒有真正學到底層的因果關系,所以模型的泛化能力很差,如果沒有新的數(shù)據(jù)做支持,模型就很難適應新的場景,換而言之,模型會出現(xiàn)一些過擬合的表現(xiàn),甚至學習到數(shù)據(jù)本身隱性偏差的問題。

所以使用 AI 模型時,你有時候并不知道什么時候能夠真正地信任它,如果對黑盒算法進行更多可解釋性的分析,將其與 AI 模型相結合,或許會成為未來的主要發(fā)展趨勢之一。

以小分子制藥為例,如果結合自由能的預測,或是基于靶點口袋的分子生成,或是對先導化合物進行優(yōu)化改造,將微觀物理的信息融入到深度學習框架之中,這個模型就能夠更好地學習到真實的因果關系或物理規(guī)律,模型的魯棒性和可靠性也會得到大幅提升。

另一個方向則是直接用 AI 來加速傳統(tǒng)計算,在傳統(tǒng)計算的框架之下,用 AI 來解方程,有希望在不喪失計算精度的情況下大幅提升計算效率。

雷峰網(wǎng):在算法層面,AI 制藥平臺之間能否形成技術壁壘?

謝昌諭:如果單看一個小模型,我認為比較難形成技術壁壘。

不能形成技術壁壘其實也可能是一個好事情。

現(xiàn)在很多被廣泛使用的模型本身就是源于互聯(lián)網(wǎng)或其他行業(yè),比如自然語言處理、圖像識別等領域的算法,研發(fā)者將其開源之后又被 AI 制藥的研發(fā)人員拿過來優(yōu)化、使用。

在這樣的大環(huán)境之下,研發(fā)者們被鼓勵將自己的算法進行開源,促進整個領域的發(fā)展。

此外,如今深度學習領域有很多好的建模軟件和工具,可以幫助非專家級的使用者輕松地將不是特別復雜的模型調(diào)到穩(wěn)定水平。

從算法的層面來說,很難形成技術壁壘,但對于大模型而言,就比較容易形成壁壘。

雖然模型的設計思路是透明的,但是如何收集、清理訓練模型所需的數(shù)據(jù),以及訓練龐大模型的技巧等等,這些復雜且大規(guī)模的工作更容易產(chǎn)生技術壁壘。

雷峰網(wǎng):數(shù)據(jù)問題一直是 AI 制藥領域的痛點,已經(jīng)成為目前制約 AI 藥物研發(fā)的重要因素之一。

目前已經(jīng)有企業(yè)嘗試建立數(shù)據(jù)共享平臺,在保證數(shù)據(jù)隱私的前提下,推動藥企之間的數(shù)據(jù)共享,在您看來這種合作形式是否符合 AI 制藥平臺當下的需求?

謝昌諭:如果能夠實現(xiàn)共享數(shù)據(jù),肯定是利大于弊的,聯(lián)邦學習等技術一定程度上能夠保護數(shù)據(jù)的隱私,如果藥企都參與進來,就可以得到表現(xiàn)更好的模型。

在歐洲有一個項目叫做 MELLODDY,即 Machine Learning Ledger Orchestration for Drug Discovery ( 機器學習分類帳編排的藥物發(fā)現(xiàn) ) 。

強生的子公司 Janssen Pharmaceutica NV(楊森制藥)是該項目的制藥行業(yè)負責人。

項目匯集了楊森制藥、安進、安斯泰來、阿斯利康、拜耳、勃林格殷格翰、葛蘭素史克、默克、諾華和施維雅等 10 家頂尖制藥企業(yè),兩所高校,四家初創(chuàng)公司,以及 IT 企業(yè)英偉達。

該項目旨在創(chuàng)建一個建模平臺,在該平臺上可以利用多家制藥企業(yè)的數(shù)據(jù),創(chuàng)建更準確的模型,以確定藥物開發(fā)最有效的化合物。

在不久前的 DrugFlow1.0 產(chǎn)品發(fā)布會的圓桌討論環(huán)節(jié)上, 也得知 MELLODDY 項目的一些進展。

比如,該項目對藥企模型的提升有一些幫助,但并不像大家初期預測的那么大,有很多算法的細節(jié)仍有待突破,比如不同藥企的數(shù)據(jù)存在不一致性等問題。

所以,并不是大家把數(shù)據(jù)拿出來共享就能馬上取得很大的突破,其中還有很多困難需要克服,從歐洲的案例中我們也可以看到在技術層面需要優(yōu)化的很多細節(jié)。

不過,長遠來看這肯定是一件好事。

雷峰網(wǎng):2022 年,AlphaFold2 與 ESMFold 分別宣布預測出數(shù)億種蛋白質(zhì),AI 技術在蛋白質(zhì)預測上的不斷突破,對制藥領域有哪些影響?

謝昌諭:AlphaFold2 和 ESMFold 等產(chǎn)生的價值是清晰可見的,無形之中增加了大家對 AI 這個領域能夠的信心,從而持續(xù)進行資金或科研上的投入。

單就蛋白質(zhì)折疊這個問題而言,目前已經(jīng)取得了很大的進展。

最近特別熱門的 ChatGPT 等生成式 AI 也是下一波發(fā)展的契機,將會為科研人員的生產(chǎn)力、科學研究的生產(chǎn)效率帶來提升。

更具體地來看,AlphaFold2 和 ESMFold 這一類算法,最早影響到的就是基于蛋白質(zhì)結構的材料設計與藥物設計,從 David Baker 團隊的蛋白質(zhì)結構設計工作中也可窺見一二。

結構預測模型使蛋白質(zhì)設計獲得了非常迅猛的進展,對藥物遞送、藥物開發(fā)等工作產(chǎn)生了直接的沖擊。

就我所關注的小分子而言,很多靶點目前還沒有合適的結構,現(xiàn)在利用 AlphaFold2 的技術,大家也在探索是否可以預測一些適合進行藥物開發(fā)的靶點口袋。

AI 制藥企業(yè)英矽智能此前就做了一些類似的工作,基于 AlphaFold2 進行藥物開發(fā)。

這些進展都是實實在在的證明,AlphaFold2 和 ESMFold 這些工具經(jīng)過未來的持續(xù)優(yōu)化,也會在藥物設計領域逐漸占據(jù)重要的位置。

雷峰網(wǎng):AI 技術天然具有快速迭代的特征,制藥卻是一項戰(zhàn)線漫長的工作,兼具這兩種特征的 AI 制藥,應該怎樣融合兩種思維?

謝昌諭:現(xiàn)在的 AI 技術的確發(fā)展很快,但這并不完全是 AI 技術本身的特質(zhì)。

節(jié)奏快更多是互聯(lián)網(wǎng)企業(yè)的特征,只是目前很多很好的 AI 工作都是由互聯(lián)網(wǎng)公司完成的,可能大家因此認為所有 AI 技術一定都是快速迭代的。

此外,目前 AI 制藥領域的初創(chuàng)公司,其實更多還是聚焦在早期藥物研發(fā)的階段,比如藥物發(fā)現(xiàn)等等。

在這些環(huán)節(jié)中,利用 AI 等技術已經(jīng)能夠縮短研發(fā)時間,所以戰(zhàn)線也不算特別長了。

因此,就節(jié)奏快慢而言,AI 技術與早期藥物研發(fā)似乎并沒有太大沖突。

比較關鍵的是,做計算的可以不斷地去試錯并調(diào)整,但做藥的人往往會更謹慎的去對待不同的實驗嘗試。

面向藥物研發(fā)這樣復雜的工程難題,一個團隊里也應該存在不同的價值觀或聲音,大家通過交流,協(xié)商出更好的解決方案。

關鍵詞:

本文來源: 雷鋒網(wǎng)


上一篇: 焦點!農(nóng)行k寶證書下載不了_農(nóng)行k寶證書下載
下一篇: 最后一頁

為您推薦
推薦閱讀

資訊

行業(yè)

服務

人才