編者按:啟明創(chuàng)投投資企業(yè)深勢科技近日取得多個進(jìn)展:在《麻省理工科技評論》中國·第二屆生命科學(xué)創(chuàng)業(yè)大賽總決賽中榮獲技術(shù)突破獎;深勢科技分別與晶泰科技、另一家啟明創(chuàng)投投資企業(yè)芯宿科技達(dá)成戰(zhàn)略合作,與前者的合作旨在共建藥物研發(fā)領(lǐng)域的開放生態(tài),助力智能化、自動化賦能臨床前藥物研發(fā)全流程,與芯宿科技的合作將聚焦源頭創(chuàng)新,通過深度合作為研發(fā)新型藥物和蛋白拓展新思路并提供全新的科研范式。由此看來,通過基礎(chǔ)科學(xué)的不斷突破加速生命健康產(chǎn)業(yè)的科技成果轉(zhuǎn)化與商業(yè)化落地顯得尤為重要。
深勢科技創(chuàng)始人兼首席科學(xué)家張林峰在接受新華網(wǎng)專訪時,指出基礎(chǔ)研究的重要性日漸提高,且從原始創(chuàng)新到產(chǎn)業(yè)落地的周期變短,他分享成立深勢科技是為了幫助科研人員加速基礎(chǔ)研究進(jìn)程,站在AI的肩膀上做科研創(chuàng)新。他進(jìn)一步分析了AI大模型的工業(yè)應(yīng)用前景,并強(qiáng)調(diào)通過生態(tài)協(xié)同建立全新的工業(yè)軟件平臺。啟明創(chuàng)投微信公眾號經(jīng)授權(quán)轉(zhuǎn)載。
深勢科技創(chuàng)始人兼首席科學(xué)家張林峰
以人工智能為代表的新一輪科技革命和產(chǎn)業(yè)變革方興未艾。這樣一個時代,呼喚勇立技術(shù)潮頭的搏擊者,也一定能造就這樣的搏擊者。
作為深勢科技首席科學(xué)家,張林峰是一個簡單純粹的人,一直執(zhí)著攀登技術(shù)巔峰。作為深勢科技創(chuàng)始人,張林峰懷有技術(shù)人共有的一個夢想,去追尋科技的星辰大海,做一家源自中國、面向未來、引領(lǐng)世界的公司。
AI for Science是公認(rèn)的發(fā)生在當(dāng)下的科學(xué)革命,張林峰帶領(lǐng)著團(tuán)隊(duì),成為這場科學(xué)研究范式的踐行者。近日,新華網(wǎng)專訪了張林峰。采訪中,他結(jié)合從事基礎(chǔ)研究的經(jīng)歷,分享了AI技術(shù)的最新趨勢,以及AI對底層科研、對工業(yè)革新的推動作用。
01/
AI加快基礎(chǔ)研究轉(zhuǎn)化效率
根基不牢,地動山搖。國家將基礎(chǔ)研究作為科技自立自強(qiáng)的根基,足見其重要性。
無論是在北京大學(xué)讀本科,還是在普林斯頓大學(xué)留學(xué)深造,張林峰所學(xué)的一直都是基礎(chǔ)研究中的基礎(chǔ)學(xué)科。十多年深鉆細(xì)研,張林峰不僅坐住了“冷板凳”,更洞察到了其中的新變化。
基礎(chǔ)研究是科學(xué)體系的源頭,它能變不確定性為確定性,變未知為已知。“基礎(chǔ)研究是一個國家核心競爭力所在。當(dāng)下,國家需要的發(fā)展動力越來越指向基礎(chǔ)研究,指向原始創(chuàng)新?!睆埩址逭J(rèn)為,基礎(chǔ)研究的重要性毋庸置疑。
除了重要性,張林峰還發(fā)現(xiàn),從原始創(chuàng)新到產(chǎn)業(yè)落地的效率和速度大大加快。“以前,如果說是30年的話,現(xiàn)在從原始創(chuàng)新到應(yīng)用落地的這樣一個鏈條,在我們看來只需要3到5年?!?/span>
從原始創(chuàng)新到技術(shù),再從產(chǎn)品到商業(yè)化,每個環(huán)節(jié)沒變,客觀規(guī)律也沒變,但時間為什么大大縮短?
“這是因?yàn)檎麄€轉(zhuǎn)化、流轉(zhuǎn)的效率變高了。在這個過程中,我們需要經(jīng)常改變我們的視角,去做一個更加全局的所謂技術(shù)上的‘診斷’?!?strong>張林峰說,當(dāng)技術(shù)的卡點(diǎn)存在于原始創(chuàng)新這一階段,一旦卡點(diǎn)被突破,下一個階段可能就直接進(jìn)入商業(yè)化,而不是產(chǎn)品這一環(huán)節(jié)。
一方面重要性提升,另一方面從開始到落地的周期變短。在這樣一個大背景下,基礎(chǔ)研究其實(shí)已經(jīng)迎來極為重要的發(fā)展節(jié)點(diǎn)。
正因?yàn)檎麄€科研生態(tài)已經(jīng)變化,張林峰提出,“必須在全新的視角之下,去定義我們最該做的、屬于當(dāng)下的事情”。在他看來,成立深勢科技,引領(lǐng)“AI for Science”發(fā)展,就是他和團(tuán)隊(duì)當(dāng)下最該做的事。
深勢科技自成立就致力于運(yùn)用AI和分子模擬算法,結(jié)合先進(jìn)的計算手段求解重要的科學(xué)問題,為人類文明最基礎(chǔ)的生物醫(yī)藥、能源、材料和信息科學(xué)與工程研究打造新一代微尺度工業(yè)設(shè)計和仿真平臺。
對科研人員來說,時間比金錢更寶貴。深勢科技就像是催化劑,幫助科研人員加速基礎(chǔ)研究進(jìn)程。
“可能我們第一波造福的不是產(chǎn)業(yè)界的人,而是同樣面臨前沿發(fā)展驅(qū)動的、一些更加追求創(chuàng)新研究的科學(xué)家、科研人?!?/strong>張林峰說,過去這些科研人員在給定的技術(shù)條件之下做實(shí)驗(yàn)、做理論模擬,但他們同樣也需要跟上時代革新的步伐,站在AI的肩膀上做科研創(chuàng)新。
02/
底層科技突破的重構(gòu)意義
2020年,張林峰的科研事業(yè)迎來高光時刻。
由他作為負(fù)責(zé)人帶領(lǐng)的團(tuán)隊(duì),憑借新一代分子模擬方法研究成果獲得當(dāng)年度具有“超算界諾貝爾獎”之稱的戈登·貝爾獎。該成果還與量子優(yōu)越性、人造太陽等一起入選2020中國十大科技進(jìn)展。
一直以來,人們都希望從第一性原理、從薛定諤方程這種最基本的規(guī)律出發(fā),求解材料、藥物、化工等普遍關(guān)心的微觀世界的秘密。但由于算法過于復(fù)雜,哪怕用超級計算機(jī),也只能算幾十個、幾百個原子規(guī)模的體系,但一個蛋白,加上周圍的環(huán)境,至少幾萬、幾十萬個分子。換句話說,即便人類熟知微觀世界的基本規(guī)律,但微觀世界的復(fù)雜現(xiàn)象依舊無法用計算機(jī)模擬。
如何決定一款藥物或者材料的性能,是一個原則上可算但實(shí)際上因復(fù)雜度太高做不了的事情。這個難點(diǎn),正是AI可以發(fā)揮作用的起點(diǎn)。
張林峰表示,微觀世界的數(shù)據(jù)通過AI學(xué)習(xí),能夠讓AI掌握相應(yīng)應(yīng)用方向的物理規(guī)律。同時,AI也能做更大規(guī)模、更長時間尺度的計算,然后在高性能計算的優(yōu)化下達(dá)到新的極致。
最終,項(xiàng)目團(tuán)隊(duì)通過機(jī)器學(xué)習(xí)將分子動力學(xué)極限從基線提升到了1億原子的驚人數(shù)量,同時仍保證了從頭算的高精度,效率是之前人類基線水平的1000倍。這是第一次把AI和物理規(guī)律、物理方程以及高性能計算緊密結(jié)合。
回溯過往,戈登·貝爾獎的評選一直鼓勵用最大規(guī)模的高性能算力去做最好的應(yīng)用。張林峰團(tuán)隊(duì)的項(xiàng)目之所以獲獎,其更大的意義就是能解決實(shí)際問題,并把相關(guān)行業(yè)的人才聚合到一起。
張林峰用“重構(gòu)”這個關(guān)鍵詞定位這項(xiàng)獲獎成果的核心意義?!八鼜V泛的影響在于學(xué)科的重構(gòu)。其實(shí)所有這些行業(yè)已經(jīng)因?yàn)锳I和計算能力的提升被重構(gòu)了。這樣的重構(gòu),也意味著人們的知識體系、協(xié)同模式以及復(fù)合學(xué)科的重組?!?/strong>過去,數(shù)理化、計算機(jī)、生物醫(yī)藥和材料都是分散的學(xué)科,這些學(xué)科之下又分了很多類型,這些細(xì)分類型零散分布于這些學(xué)科下設(shè)的三級目錄中。而基于AI的分子動力學(xué)模擬方法,將精確的物理建模帶入到更大尺度的材料模擬中,為打通力學(xué)、化學(xué)、材料、生物乃至工程學(xué)科,解決實(shí)際問題發(fā)揮出積極作用。
正如張林峰所言,基礎(chǔ)研究到應(yīng)用落地的周期縮短,這與機(jī)器學(xué)習(xí)模擬上億原子這類重大科學(xué)突破密不可分。底層科技突破的意義,就在于可以催生出一系列新的創(chuàng)新。
比如,藥物研發(fā)難度大、投入高、風(fēng)險大、周期長。張林峰以藥物研發(fā)舉例說,要破解其中的核心瓶頸,就需要進(jìn)一步求解物理方程和分析大量數(shù)據(jù)的能力。受益于技術(shù)紅利,結(jié)合AI、物理模擬、仿真等一系列技術(shù),能夠讓藥物從立項(xiàng)到臨床前的整個研發(fā)流程大大縮短。
這項(xiàng)能力是AI的這一波進(jìn)展帶來的。在藥物、材料研發(fā)等更廣泛的領(lǐng)域,印證了張林峰談到的“從基礎(chǔ)研究到落地應(yīng)用只需三五年時間”。
03/
AI大模型的工業(yè)應(yīng)用前景
近期,火熱的ChatGPT引發(fā)業(yè)內(nèi)人士思考。事實(shí)上,超強(qiáng)算力、大模型技術(shù)并不新鮮,但能將這些技術(shù)發(fā)揮到極致,讓人覺得產(chǎn)品有用卻并不容易。
在張林峰看來,ChatGPT的產(chǎn)品形式非常巧妙,它在開發(fā)之初就在思考這種產(chǎn)品怎么才能被用起來、以怎樣的技術(shù)形式規(guī)?;涞??!皬脑紕?chuàng)新一直到產(chǎn)品,到大規(guī)模落地,這么大規(guī)模的一個原始技術(shù)突破的過程中,能夠做到這么高的效率,其實(shí)非常值得大家思考?!?/span>
預(yù)訓(xùn)練模型是推動AI應(yīng)用的重要基礎(chǔ)設(shè)施,也是全球科技巨頭競相角逐的焦點(diǎn)。
與ChatGPT專注自然語言處理不同,去年年底,深勢科技、北京科學(xué)智能研究院(AISI)以及項(xiàng)目合作者,聯(lián)合發(fā)布了首個覆蓋元素周期表近70種元素的深度勢能原子間勢函數(shù)預(yù)訓(xùn)練模型“DPA-1”。這一創(chuàng)新成果在模型覆蓋范圍、通用性、計算精度以及未來的AI生成等方面實(shí)現(xiàn)新突破,被視為AI for Science走向大規(guī)模應(yīng)用的重要里程碑。
用過“DPA-1”的開發(fā)者們會發(fā)現(xiàn),它就像是自然科學(xué)領(lǐng)域的GPT。根據(jù)需求,“DPA-1”像萬物之手一樣,能生成需要的物質(zhì)組分和結(jié)構(gòu)。它為什么能夠做到呢?
此前,曾獲戈登·貝爾獎的創(chuàng)新解決方案,其實(shí)是基于量子力學(xué)生產(chǎn)數(shù)據(jù),AI學(xué)習(xí)這些數(shù)據(jù),學(xué)完后大規(guī)模模擬。如今,這個范式已經(jīng)普及,量子力學(xué)生產(chǎn)的數(shù)據(jù)越來越多,多到已經(jīng)幾乎要覆蓋整個元素周期表。這使得這樣一個領(lǐng)域也具備了走向預(yù)訓(xùn)練模型的數(shù)據(jù)基礎(chǔ)。
“3年前,我們就想做這件事情,但是時機(jī)不成熟,原因是數(shù)據(jù)基礎(chǔ)不到位,現(xiàn)在做其實(shí)是最合適的。從社區(qū)生態(tài)上,從模型和數(shù)據(jù)的發(fā)展上,乃至從整個技術(shù)趨勢上來看,這樣的一個預(yù)訓(xùn)練模型也是呼之欲出的?!睆埩址逶f,“應(yīng)該用全新視角定義當(dāng)下該做的事情”,在他看來,這件事很顯然也屬于當(dāng)下該做的事情。
在其他領(lǐng)域,GPT的迭代周期都比較長,但張林峰認(rèn)為在分子模擬這個領(lǐng)域也許走得會更快,應(yīng)用落地的深度也更深,這是他和團(tuán)隊(duì)今年格外要解決的重點(diǎn)問題。
目前,科學(xué)計算的瓶頸在于算法面臨“維度災(zāi)難”的問題,即難以表示和難以有效地處理高位復(fù)雜的函數(shù)和大規(guī)模的復(fù)雜數(shù)據(jù)。幸運(yùn)的是,AI有望助力解決科學(xué)計算中的“維度災(zāi)難”,將不同尺度的物理模型有效連接起來。
AI向前發(fā)展有其自身規(guī)律。張林峰說,我們要做的就是借鑒AI的客觀發(fā)展規(guī)律,無論是技術(shù)側(cè)還是產(chǎn)業(yè)側(cè)的一系列發(fā)展特點(diǎn),去反思我們的技術(shù)體系。
他舉例說,過去人們曾質(zhì)疑AI落地的效果,其實(shí)把前人在不同應(yīng)用場景的經(jīng)驗(yàn)整合起來,去“翻譯”好我們的場景,比如工業(yè)軟件這樣的場景,需要啟蒙。深勢科技兼具了翻譯者、啟蒙者以及最后從頂層創(chuàng)新到落地的角色。
04/
生態(tài)協(xié)同打造工業(yè)軟件平臺
AI給基礎(chǔ)科研帶來機(jī)遇,除了凸顯基礎(chǔ)研究的重要性,也在改變從創(chuàng)新到落地的整個生態(tài)。
工業(yè)軟件被譽(yù)為“工業(yè)皇冠上的明珠”,過去一直是海外廠商占據(jù)的領(lǐng)域。隨著AI時代的來臨,中國在AI領(lǐng)域也具有顯著的人才、數(shù)據(jù)、市場、應(yīng)用等優(yōu)勢。在AI時代,工業(yè)軟件也迎來新的開始。
張林峰認(rèn)為,工業(yè)軟件的生態(tài)十分重要。它的背后需要底層算法,規(guī)?;能浖f(xié)同,以及軟件開發(fā)完之后,作為一個解決方案跟場景的落地迭代,以及反過來反哺創(chuàng)新。基于這樣的一個生態(tài),持續(xù)迭代后,它才會越來越穩(wěn)健。同時,工業(yè)軟件是工業(yè)智慧的結(jié)晶,必須要以工匠精神往深做。
對工業(yè)軟件平臺的創(chuàng)新,張林峰提示,要告別過去,用嶄新的思維去做。他說,單純算法的突破、底層硬件的突破,往往會沉淀成過去的慣性,變成一種創(chuàng)新的歷史包袱,反倒難以升級。他以深勢科技開發(fā)的藥物設(shè)計軟件平臺為例,認(rèn)為該平臺可能比已經(jīng)成長了20多年的國外平臺更輕便,是因?yàn)樯顒菘萍家龅牟还馐且环N產(chǎn)品形態(tài)和技術(shù)形態(tài)的革新,而是依靠整個公司迭代的體系和不同研發(fā)人的角色配合,才能推動這種全新的工業(yè)軟件平臺的誕生。
深勢科技提出,專注于打造微觀尺度科學(xué)研究和工業(yè)研發(fā)的基礎(chǔ)設(shè)施。張林峰一直向研發(fā)人員強(qiáng)調(diào),“軟件不是開發(fā)出來的,而是被用出來的,以需求和反饋為導(dǎo)向,持續(xù)優(yōu)化才是工業(yè)軟件的真正壁壘?!?/strong>
“沒摸過的東西,去想象我覺得不是很好?!睆埩址逭f,為了發(fā)論文而發(fā)論文不是我們鼓勵的,基于對問題更好的定義來發(fā)論文是非常好的。
張林峰鼓勵公司研發(fā)人員自由探索,認(rèn)為營造這種寬松的科研氛圍才能培育創(chuàng)新的土壤。其次,注重從定義問題到實(shí)現(xiàn)目標(biāo)過程中的協(xié)同機(jī)制,要求大家既要自我驅(qū)動,也要觀點(diǎn)碰撞,然后再建立分工,營造一個共同贏球的團(tuán)隊(duì)文化。同為科學(xué)家,他本人也一直跑在第一線,與做合金、做電池、做藥物研發(fā)的一線企業(yè)面對面交流,傾聽客戶的反饋。
從優(yōu)秀變得卓越,意味著要樹立更長期、更樸實(shí)的價值追求?!拔覀儚目茖W(xué)發(fā)展規(guī)律、從方方面面的認(rèn)知,去定義未來長久的目標(biāo),然后在這個目標(biāo)下,去倒推哪些是屬于公司當(dāng)下該做的事情,然后持續(xù)演進(jìn)?!睆埩址逭f。
創(chuàng)新既是決定未來的關(guān)鍵變量所在,又是推動人類社會進(jìn)步的核心動力。
深勢科技成立的初衷就是希望成為一家源自中國、面向未來、引領(lǐng)世界的公司?!拔磥韼啄?,可能是一個重構(gòu)的周期,我們希望經(jīng)歷這樣一個重構(gòu),在最后回頭來看時,我們是成功的。”張林峰也深信,如果公司能夠推動國內(nèi)形成一個真正原始創(chuàng)新到落地應(yīng)用的良好生態(tài),能夠成就所有合作伙伴,那公司必然就是成功的。
展望未來,張林峰希望通過不斷商業(yè)化倒逼公司形成新的技術(shù)體系。他堅(jiān)信,AI的能力還需要進(jìn)一步喚醒,AI的應(yīng)用也要深入到科學(xué)研究的更深處,能夠服務(wù)于能源、原材料等國家重大戰(zhàn)略需求,這是公司也是整個生態(tài)未來努力的方向指引。
來源 | 新華網(wǎng)
作者 | 凌紀(jì)偉