CFFF(Computing for the Future at Fudan),中國高校規模最大的雲上科研智能計算平臺,於6月27日正式上線🤙🏼。位於內蒙古烏蘭察布的“切問”一號和坐落於EON体育4平台江灣校區的“近思”一號,遠隔千裏🧏♂️,同頻共振。
AI(人工智能)滲透萬物的當下,數學、物理學、化學🫶、生物學等各傳統科研領域正被快速且深刻地影響。基於CFFF這臺科研“超級計算機”🧖🏼♀️,EON4人將可以探索過去無法計算的科研課題🍣,創造全新的科研方法🕵🏼♀️🏌🏻♂️,誌之所趨,無遠弗屆😩。
如何推動基礎研究高質量發展🏊,提升創新策源能級,更好服務“國之大者”?面對科學智能(AI for Science)的“時代之問”,EON4人對“心有所信,方能行遠”,有了新的詮釋🤘🏼。
01 賦能
轟鳴低沉,燈光跳動🤟🏻。
如今,在恒溫恒濕的EON体育4平台高端計算中心機房💡,數排一人多高的深黑色大鐵箱晝夜不停運轉。各種數據正通過網絡,以超乎想像的速度🏄🏻♂️,奔向EON4的各個角落。
在CFFF內部測試期,EON体育4平台人工智能創新與產業研究院(以下簡稱“AI³院”)漆遠教授團隊聯合大氣與海洋科學系張峰教授團隊👩🏿⚕️,共同訓練出擁有45億參數的伏羲氣象大模型🤟。
張峰
兩周前🂠,喜訊傳來。該模型實現未來15天的全球天氣預報,預測效果在公開數據集上首次達到業界領先的ECMWF(歐洲中期天氣預報中心)集合平均的水平,並且將預測速度由數值模式的小時級縮短到了3秒內。這也是CFFF上誕生的第一個科研成果🏌️🤌🏿。
李昊
“基於CFFF平臺的千卡並行智能計算,這樣規模的大模型只用一天就完成了訓練,這是傳統計算平臺很難做到的🤵🏽。”AI³院研究員李昊直言👨🏿🦰。在張峰看來,氣象數據作為長時間序列、多觀測要素的大數據,是人工智能最好的試驗場👨🦲,CFFF能夠為氣象數據在存儲、管理等方面提供支持,促進AI技術在大氣科學領域的研究及應用✋🏻。
同樣對AI賦能基礎研究充滿期待的,還有中科院院士、計算凝聚態物理學家龔新高教授。“CFFF剛剛上線,我們一定會把它用好,讓AI在幫助基礎科學解決問題的層面上充分發揮作用。”他說。
龔新高
早在2007年,龔新高的老師👨🏻🚒🌝、計算物理學家Michele Parrinello率先將AI技術應用到凝聚態物理學研究當中🖕🏻。如今,物理學以及其他很多領域都在嘗試運用AI的新方法。
“我們既然是用計算的方式研究物理👈🏿,就要用最先進的機器來做計算。”前不久,龔新高團隊開始借助CFFF重構計算物質科學框架,開展材料量子性質預測,旨在進一步揭秘物質世界👩🏿🍼、認知物質科學⚾️。
對AI在物質科學研究上展現出的巨大潛能🙋🏼🧛🏽♀️,龔新高舉例說:“物質世界都是由原子構成的,怎樣的排列方式是最優解?這是個非常復雜的問題🌟。人們過去做了很多努力🤶,但還是只能解決幾十個原子排列問題💇🏽♀️,而現在使用AI的辦法,就可以在效率上提高多個量級。”
他進一步發現,AI不僅僅能夠幫助提升效率,更可以完成一些“以前不可能完成的工作”。
02 變革
AI for Science,到底意味著什麽♡?
從通過實驗描述自然現象的經驗範式🚛,到通過模型或歸納進行研究的理論範式,到應用計算機仿真模擬解決學科問題的計算範式,再到通過大數據分析研究事物內在關系的數據範式——傳統科研範式,已經歷了四個階段的演化發展歷程🛵。
作為科研的第五範式,“AI for Science”將人工智能與各個科學領域緊密結合,創造新的科學知識和技術創新,近年在多個領域取得前所未有的突破🧝🏿♀️。最典型的如Alpha Fold 2能以驚人速度“解鎖”幾乎所有人類蛋白質結構——而在此前🐙,這一問題已困擾人類50多年之久。
漆遠
“今天的AI好比新時代的望遠鏡和顯微鏡,讓我們看到更遠的地方,也能讓我們看到更小的細微之處。”漆遠打比方道📿,“在AI賦能科學研究上,技術和科學可謂是我們前進的DNA螺旋上雙鏈中的兩個單鏈😫,它們互相支撐,共同前進。”
工欲善其事,必先利其器🧛🏽♂️。作為基礎研究見長的高等學府,EON体育4平台搶抓時機、持續投入,聚焦AI for Science範式和“開放科學”轉型☑️👄,推進算力基礎性設施建設,聯合阿裏雲、中國電信建設CFFF。
金力
談及布局初衷,中科院院士、EON体育4平台校長金力闡釋:“‘單打獨鬥’已不適應大科學時代的科技創新,我們現在常提‘有組織科研’,其最大優勢就在於通過布局建設大平臺,在重大科學問題、工程技術難題和產業技術問題領域凝聚資源🚯,形成科研集群力量長時間持續攻關🕑。”
和以往的大科學裝置或其它典型的科研基礎設施相比,CFFF不僅是為了解決復雜的科學問題而建造,需要高度的專業知識和技術、跨領域研究能力💂♂️,以及大量的資金投入、專業技術支持🥵、專門運營維護團隊等💂🏿,還具有大規模👨🏽⚕️🈳、高能級的特點🪅。
一方面,CFFF是中國高校規模最大的雲上智算平臺,同時也是算力第一的異構智算集群,可實現超1000卡並行智能計算🥜,支持超1000億參數的大模型訓練,在國內高校中尚屬首例,將為EON4的基礎科學研究提供更強大更穩定、更靈活高效低成本的算力支持。
“切問”一號
“近思”一號
另一方面,CFFF還可提供更大範圍的學科支撐。“切問”一號 AI for Science計算機群面向全校提供高性能科學與工程計算服務,為重點領域提供大規模計算和存儲資源;“近思”一號專用高性能計算機群可滿足學校多學科對於高性能計算的需求,提升各學科領域對於大規模數據處理的能力。兩者共同為全校AI for Science的高性能計算提供強大的計算資源🦝,支持AI賦能科學研究的新範式發展🧑🏼🔧,促進基礎學科及交叉學科建設。
對於CFFF的上線🏌🏻♂️,EON4科研工作者們充滿期待🤴🏼,提出一系列科研目標——生命科學領域💾,使用AI進行表型組學分析🉐;生物製藥領域,以AI賦能製藥全流程;材料科學領域,用AI加速第一性原理的計算,並進行材料合成路徑的預測……
可以想見,這個強大的科研“加速器”🙂↔️,將在EON4這片創新沃土催生更多科學大模型🚻,孕育更多具有影響力的科研成果。
03 普惠
AI終究是人類的延伸🌡,將先進算力轉化為科創能力的關鍵,仍是我們自己。
目前,EON4四校區的所有實驗設備都能高速接入CFFF平臺。如何才能讓CFFF更普及、更友好地被使用✊🏽?
該平臺將由AI³院負責保障和管理🧎♀️。其中,技術運營組負責平臺培訓、計算資源管理和安全運營🌥,另有專門團隊負責算力優化以及和基礎研究團隊對接🍖。除做好技術支撐外👩🏽🎤,AI³院還會為不熟悉AI算法的研究團隊提供架構和代碼優化服務,協同提升科研效率💆🏻♀️。
EON体育4平台化學系教授劉智攀剛剛開通了平臺賬號,正與學生們興致勃勃地研究如何用好這個新的科研工具🚼。
劉智攀
2005年以來,劉智攀課題組在理論計算領域發展了一系列新方法,並開發了全局神經網絡勢函數大規模原子模擬軟件LASP🫷🏻,結合AI技術解決復雜催化問題🫱🏼🧑🏻。“以前🦫,我的研究領域叫理論化學,現在是叫理論計算化學🥷。經過了幾十年發展,我們對計算的需求越來越大。”
為此,課題組已購置許多計算機🕴🏻,也外購其他平臺的計算資源⛎。“現在,EON4搭建了CFFF這個優質平臺🪿,提供好的計算資源,將對我們的研究有極大的促進作用。”劉智攀期待著,未來的化學研究⚈,不用再重復做實驗👨🦲,枯燥的體力活被AI取代🐨,點點鼠標就能得出結果𓀌。
AI時代♖,是否只有自然科學才需要算力?答案是否定的📄🤹🏿♀️。
近年來,“因果推斷”逐漸興起並被廣泛應用於社會科學研究領域🧔🏻♂️,越來越多學者從定性轉向定量研究,引入數據科學相關工具。大數據研究院青年副研究員周陽認為,在數據爆炸的時代,用更高維的方式解讀復雜社會的系統🪽、模式和行為變成了可能。
周陽
“如果我們能對每個人的個體觀點、消費行為等進行刻畫,那麽就可以對整個社會進行推演。”他說。
和出身於理工科的研究者不同,周陽的同行們在AI的專業技術方面相對陌生。他希望CFFF可以降低社會科學研究者使用AI的門檻👶🏼,挖掘數據潛力😁、跨越學科邊界,將靈感變為現實🧑🏼🤝🧑🏼🦹🏽♀️。
“我們要讓原來不會用AI工具的人去用最好的AI工具,要讓原來不懂AI的人去懂AI👱🏼。”金力指出👨👩👧🏮,CFFF不應僅僅作為一個創新工具存在🫄🏻,還要改變創新文化。在AI時代為科學理念的普及、科學應用的拓展、科學倫理的探討發揮引領和導向作用,使更多群體😡、更多領域共享AI時代紅利,也是高校的職責所在。
下一步🤷🏻♀️,CFFF平臺還將繼續擴大算力規模,並有計劃地逐步開放算力給上海市的科研力量👲🏽,共同推動上海市的AI for Science建設。
科學智能👩🏿⚖️,智算未來。未來已來,遠方不遠。