更新時間:2025-01-07 21:58:27作者:佚名
11月11日,復(fù)旦大學(xué)與上海科學(xué)情報研究院(以下簡稱“上海研究院”)自主研發(fā)的“科學(xué)情報十大前沿觀察”及四大科學(xué)模型在科學(xué)情報創(chuàng)新論壇上發(fā)布。其中,Planet Intelligence@Climate(PI@Climate)大語言模型是中國第一個自主研發(fā)的氣候領(lǐng)域大語言模型。
論壇匯聚全球頂尖科學(xué)家和行業(yè)領(lǐng)袖,圍繞AI科學(xué)雙螺旋引擎的構(gòu)建進行深入探討,探索人工智能與生命科學(xué)、材料科學(xué)、化學(xué)、物理、地球等前沿領(lǐng)域科學(xué)、海洋科學(xué)、社會科學(xué)和許多其他科學(xué)領(lǐng)域。創(chuàng)新、實施場景和產(chǎn)業(yè)實踐。
論壇上,上海應(yīng)用技術(shù)大學(xué)與復(fù)旦大學(xué)、德勤咨詢(上海)有限公司、上海海洋大學(xué)、國家蛋白質(zhì)科學(xué)研究(上海)基地簽署了三項重要合作協(xié)議,并向獲獎?wù)哳C獎第二屆世界科學(xué)智力競賽。
復(fù)旦大學(xué)黨委書記邱新,中國科學(xué)院院士、北京科學(xué)智能研究院院長、北京大學(xué)國際機器學(xué)習(xí)研究中心主任鄂偉南院士美國國家科學(xué)院院士、加州大學(xué)舊金山分校藥物化學(xué)系教授。德格拉多,上海市委組織部副部長、市人才局局長潘小剛,上海市徐匯區(qū)委副書記、區(qū)長王華復(fù)旦附中國際部,復(fù)旦大學(xué)常務(wù)副校長曲征,上海市科學(xué)技術(shù)委員會副主任魏、上海市經(jīng)濟和信息化委員會副主任張洪濤、上海市教育委員會副主任劉力、市委副書記付袁正紅大學(xué)黨委書記上海醫(yī)學(xué)院院長王洪洲,上海海洋大學(xué)黨委書記唐正,中國科學(xué)院上海高等研究院黨委副書記蔣英,德勤中國主席徐金波,分子心臟創(chuàng)始人、國際計算生物學(xué)會院士、尚志研究院院長齊源、復(fù)旦大學(xué)郝慶教授出席。
邱欣、王華、曲偉、張洪濤、劉莉致辭。復(fù)旦大學(xué)校長助理、尚志研究院院長、上海創(chuàng)智研究院副院長吳立波主持活動。
論壇在復(fù)旦大學(xué)楓林校區(qū)舉行。本次會議由上海市科委、徐匯區(qū)人民政府指導(dǎo),復(fù)旦大學(xué)、尚智研究院主辦,上海交通大學(xué)、西湖大學(xué)、上海創(chuàng)智研究院、集智俱樂部協(xié)辦。此次論壇也是中華人民共和國科學(xué)技術(shù)部和上海市人民政府共同主辦的2024浦江創(chuàng)新論壇的主題論壇之一。
深度開發(fā)科學(xué)智能
創(chuàng)建高度通用和高性能的模型
“服務(wù)新生產(chǎn)力發(fā)展,是增強創(chuàng)新源動力、支撐引領(lǐng)中國式現(xiàn)代化的重要使命。作為這場科技變革的見證者和參與者,復(fù)旦始終積極探索科學(xué)化、智能化發(fā)展新范式,創(chuàng)造了新的發(fā)展模式。”人工智能產(chǎn)業(yè)創(chuàng)新和人才培養(yǎng)高地。”邱欣說。在海視戰(zhàn)略布局下,復(fù)旦大學(xué)以科學(xué)技術(shù)研究院為支點,推動科學(xué)智能深入發(fā)展,初步構(gòu)建了人工智能課程體系和AI+復(fù)合型學(xué)位人才培養(yǎng)體系。學(xué)校有100多個AI4S科研團隊,正在努力推進。科學(xué)智力成果應(yīng)用、產(chǎn)教融合。
鄂偉南以“Uni-Mol,分子設(shè)計的基礎(chǔ)模型”為題,分享了其團隊開發(fā)的Uni-Mol分子設(shè)計模型。其參數(shù)量達到1.1B,是目前最大的3D分子基礎(chǔ)模型。他表示,分子設(shè)計已經(jīng)進入深度學(xué)習(xí)和生成模型方法階段。面對碎片化、環(huán)節(jié)多、數(shù)據(jù)稀缺等問題,基于分子基礎(chǔ)模型的通用分子設(shè)計將是解決這些挑戰(zhàn)的有效途徑。目前,Uni-Mol已經(jīng)從事藥物分子設(shè)計的高效分子對接、OLED發(fā)光分子設(shè)計、各種氣體分離的有機金屬骨架材料分子設(shè)計、浸入式冷卻劑設(shè)計、鋰電池電解液配方設(shè)計等。被應(yīng)用到.他呼吁進一步加強數(shù)據(jù)共享和開放,與實驗形成自動化閉環(huán),從而推動通用能力更強、性能更好的分子基礎(chǔ)模型的發(fā)展。
人工智能和科學(xué)是雙向的,深度融合。
科學(xué)情報十大前沿領(lǐng)域是什么?
隨著2024年諾貝爾物理化學(xué)獎授予人工智能相關(guān)研究,科學(xué)智能及其研究方向引起了科學(xué)家到公眾的廣泛關(guān)注。基于大量從事科學(xué)智能領(lǐng)域前沿研究的學(xué)者的深度訪談,中科院與合作伙伴共同總結(jié)了科學(xué)智能新范式,梳理凝結(jié)了科學(xué)智能的十大切入點。 -科學(xué)情報的邊緣方向。
“什么是科學(xué)情報?我們試圖給出一個新的定義。”尚智研究院院長齊源在《科學(xué)智能前沿觀察》中指出,科學(xué)智能(AI X Science)是一個新興的跨學(xué)科研究領(lǐng)域,致力于將人工智能(AI)與領(lǐng)域科學(xué)相融合,其研究方向和驅(qū)動力可以形象地形容為“雙螺旋發(fā)動機”:一是將人工智能技術(shù)應(yīng)用于特定學(xué)科的新興研究方法(AI for Science);第二,將特定領(lǐng)域的學(xué)科知識應(yīng)用于人工智能算法和架構(gòu)的理解和改進(Science for AI)。
此次發(fā)布的《科學(xué)智能前沿觀察》涵蓋了AI for Science、Science for AI和科學(xué)智能基礎(chǔ)設(shè)施三個維度。其中,AI for Science的前沿方向包括垂直領(lǐng)域的大型科學(xué)模型、融合先驗知識的AI模型、基于LLM模型的科學(xué)研究、從假設(shè)提出到自動驗證的AI科學(xué)家、復(fù)雜世界的多智能體建模等。 ; Science for AI的前沿方向涵蓋了物理世界的首要原理和受科學(xué)啟發(fā)的可解釋的AI新架構(gòu);科學(xué)智能基礎(chǔ)設(shè)施的前沿方向包括合成數(shù)據(jù)和新型智能計算。展望未來,以可信、可解釋為導(dǎo)向的科學(xué)世界模式與上述九個方向共同構(gòu)成了科學(xué)智能的十大前沿。
“未來,我們渴望有更多獲得諾貝爾獎的科學(xué)情報研究成果。”齊源表示,上海應(yīng)用技術(shù)大學(xué)與合作伙伴發(fā)布“科學(xué)智能前沿觀察”的初衷是為了推動和支持更多科學(xué)家在人工智能和基礎(chǔ)研究領(lǐng)域的發(fā)展。深度融合、無縫合作復(fù)旦附中國際部,共同探索科學(xué)智能新未來,打造能夠獨立發(fā)現(xiàn)復(fù)雜世界未知規(guī)律的“AI愛因斯坦”。
復(fù)旦四大AI模型上線
取得多項重要突破
中國首個自主研發(fā)的氣候領(lǐng)域大語言模型
上海科學(xué)情報研究院首席戰(zhàn)略官、復(fù)旦大學(xué)兼職教授楊延慶主持成果發(fā)布會。
值聯(lián)合國氣候變化框架公約第二十九次締約方大會(COP29)之際,復(fù)旦大學(xué)聯(lián)合上海應(yīng)用技術(shù)大學(xué)、上海創(chuàng)智研究院推出行星情報@氣候(PI@Climate)大語言模型,旨在為氣候變化領(lǐng)域的科學(xué)研究、國際氣候談判和政策分析提供全面的知識支持。團隊負責人吳立波比喻道:“相當于氣候變化科學(xué)家。”
氣候變化科學(xué)研究具有很強的跨學(xué)科性,涵蓋農(nóng)業(yè)、林業(yè)、能源科學(xué)、水利工程、環(huán)境科學(xué)、管理學(xué)、經(jīng)濟學(xué)、政治學(xué)、法學(xué)等多個學(xué)科。這就是為什么應(yīng)對氣候變化的全球行動必須如此。基于連接地球系統(tǒng)、自然系統(tǒng)和社會經(jīng)濟系統(tǒng)的綜合評估模型進行指導(dǎo)的重要原因。
科學(xué)家如何找到有關(guān)氣候變化最全面、最有效的數(shù)據(jù)、模型、機制和政策?據(jù)介紹,從有價值信息種子的識別,到領(lǐng)域發(fā)現(xiàn),再到模型細化,該團隊不僅進行了技術(shù)創(chuàng)新,還引入了超過2600億字的氣候變化領(lǐng)域知識,位居當前氣候變化領(lǐng)域之列。已知的氣候變化模型。最多。為了加強專業(yè)領(lǐng)域的知識理解,團隊邀請了來自國家氣候變化專業(yè)科研機構(gòu)和頂尖大學(xué)的100余位氣候變化領(lǐng)域?qū)<覅⑴c研究,篩選出近2萬對優(yōu)質(zhì)對子來自 40,000 多個問答對。問答對加強專業(yè)知識的監(jiān)督,提高模特的專業(yè)能力。
在氣候變化這個學(xué)科高度交叉的領(lǐng)域,模型專業(yè)能力的評估是一個巨大的挑戰(zhàn),團隊也在這個問題上取得了重大突破。 “我們跨越46個學(xué)科領(lǐng)域,構(gòu)建了約7740個氣候評估問題的數(shù)據(jù)集,填補了目前氣候領(lǐng)域大型模型評估數(shù)據(jù)集的空白。”吳立波解釋道。
未來國際氣候治理、氣候投融資、能源電力系統(tǒng)低碳技術(shù)發(fā)展等都是該模式的重要使用場景。為了讓模型更好地理解用戶的問題,團隊構(gòu)建了智能代理,通過思維鏈訓(xùn)練提高模型的邏輯推理能力,模仿人類處理氣候變化科學(xué)問題時的思維過程。據(jù)悉,氣候評估環(huán)節(jié)的PI已經(jīng)過中國氣候代表團專家的試用,他們的反饋“非常專業(yè)”。
人工智能幫助解碼遺傳“暗物質(zhì)”
女媧模型的名字意義深遠,源于中國古代神話,象征著對生命科學(xué)規(guī)律的探索和掌握。 “我們希望這個模型能夠像女媧創(chuàng)造人類一樣,掌握人類生命科學(xué)的基本規(guī)律。”復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院副院長、研究員、尚智研究院AI科學(xué)家程遠表示,其團隊開發(fā)的女性模型Wa基因?qū)Ш交A(chǔ)模型基于圖神經(jīng)網(wǎng)絡(luò)預(yù)構(gòu)建訓(xùn)練和知識圖譜技術(shù),可以支持單細胞分辨率下長距離基因調(diào)控關(guān)系的高精度預(yù)測。尤其是在監(jiān)管距離超過100kb的遠程監(jiān)管關(guān)系預(yù)測任務(wù)中,該模型的預(yù)測精度相比現(xiàn)有方法提高了一倍以上。
在DNA序列中,約占DNA的98.5%的非編碼區(qū)調(diào)節(jié)編碼區(qū)的表達。某些基因非編碼區(qū)的變異可導(dǎo)致小鼠急性白血病和肢體發(fā)育不良等疾病。但在非編碼區(qū)的研究中,由于基因“暗物質(zhì)”分布廣泛、距離調(diào)控位點較遠、不同細胞內(nèi)基因調(diào)控差異明顯,AI此前應(yīng)用相對較少,面臨諸多挑戰(zhàn)。
為了克服這些問題,研發(fā)團隊設(shè)計了女媧基因?qū)Ш交A(chǔ)模型,該模型可以對基因組的非編碼“暗物質(zhì)”區(qū)域進行功能注釋,發(fā)現(xiàn)復(fù)雜疾病的機制和可能的疾病治療靶點。目前該模型在預(yù)測不同細胞組織的調(diào)控關(guān)系方面具有優(yōu)異的性能。與實驗驗證結(jié)果相比,準確率可達85%以上。遠距離監(jiān)管關(guān)系的預(yù)測精度比現(xiàn)有最佳模型高出兩倍以上。例如,它在大腦皮層、大腦前額葉、骨髓等細胞組織中具有優(yōu)異的表現(xiàn)。
女媧基因?qū)Ш交A(chǔ)模型產(chǎn)業(yè)化潛力巨大。通過發(fā)現(xiàn)新的疾病靶點,這種模式不僅可以開發(fā)擁有自己IP的藥物,還可以為合作公司提供新靶點發(fā)現(xiàn)服務(wù)。還可以為合作企業(yè)提供已知靶點的計算驗證服務(wù),為新藥研發(fā)提供支持。并給疾病治療帶來革命性的變化。
借助女媧遺傳導(dǎo)航基礎(chǔ)模型,研究人員在實際應(yīng)用中取得了重要發(fā)現(xiàn)。例如,在分析阿爾茨海默病患者的基因突變時,通過常見的非編碼區(qū)突變發(fā)現(xiàn)了新靶點,為阿爾茨海默病藥物研發(fā)開辟了新路徑。這一模型的出現(xiàn)將把微觀領(lǐng)域的生命科學(xué)研究推向新的高度,并有望對未來醫(yī)學(xué)和藥物研發(fā)領(lǐng)域產(chǎn)生深遠影響。
徹底改變生命流體模擬和醫(yī)療應(yīng)用
生命中的流體分析,如血管中的血液流動、呼吸時從口腔到肺部的氣流,甚至懷孕和分娩時羊水的狀況,對于生命和分娩的研究和臨床實踐極為關(guān)鍵。健康。程媛團隊開發(fā)了女媧生命流體基礎(chǔ)模型,這是一種基于醫(yī)學(xué)圖像預(yù)訓(xùn)練的物理保守的端到端模型,可以支持復(fù)雜幾何形狀的高精度物理流場模擬。
通過醫(yī)學(xué)圖像幾何約束和物理方程約束,該模型在實際臨床場景中復(fù)雜血管幾何形狀的高精度血流動力學(xué)模擬中表現(xiàn)良好。以實際血管幾何數(shù)據(jù)為例,可以實現(xiàn)速度物理模擬誤差僅為8%。這一數(shù)據(jù)大大超過了JMLR 2024中公布的方法,計算效率比傳統(tǒng)CFD提高了一百倍,極大地提高了模擬的準確性和時效性。
該模型對生物體復(fù)雜管網(wǎng)流速的預(yù)測誤差極低,僅為0.06米/秒。在實際臨床應(yīng)用場景中,該模型可以輔助科學(xué)研究壁剪切力與血管壁增厚的相關(guān)性,以及腦動脈瘤破裂風險評估等臨床診斷。未來,該模型還可以在心血管血流模型分析、腦動脈瘤破裂風險評估、動脈狹窄支架設(shè)計等多種心腦血管疾病的智能診療中發(fā)揮其產(chǎn)業(yè)潛力。
目前,該模型已順利完成流體模擬計算流程的搭建。與附屬華山醫(yī)院在腦血管瘤風險評估場景方面有深度合作,并應(yīng)用于臨床。還與附屬口腔醫(yī)院合作,評估口腔及扁桃體畸形對氣流的影響。它還與其他醫(yī)院合作,共同模擬心臟內(nèi)部畸形或疾病時的血流,這些合作將有效促進醫(yī)療衛(wèi)生技術(shù)的進步和發(fā)展。
突破性的 AlphaFold3
動態(tài)結(jié)構(gòu)預(yù)測的局限性
在生命科學(xué)和藥物開發(fā)領(lǐng)域網(wǎng)校頭條,了解蛋白質(zhì)、RNA、DNA 和小分子如何在生物體中相互作用對于揭示多蛋白質(zhì)結(jié)構(gòu)-功能關(guān)系和藥物開發(fā)至關(guān)重要。復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院研究員、尚智研究院AI科學(xué)家朱思宇團隊研發(fā)的女媧生物分子結(jié)構(gòu)模型,是業(yè)界首個基于擴散模型的蛋白質(zhì)動態(tài)3D結(jié)構(gòu)預(yù)測模型。該模型突破了AlphaFold3的動態(tài)結(jié)構(gòu)在預(yù)測中的局限性。
該模型根據(jù)不同的數(shù)據(jù)特??征,采用不同的分子處理級別,并將其統(tǒng)一到token級別,以獲得生物分子復(fù)合結(jié)構(gòu)的幾何嵌入信息。同時,該模型利用協(xié)同進化信息和模板信息對復(fù)合體中原子之間的相互作用進行建模,并通過擴散模型實現(xiàn)原子級坐標建模,捕獲蛋白質(zhì)與其他生物分子之間的相互作用,達到了Alphafold3同一級別。
作為蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的領(lǐng)導(dǎo)者,AlphaFold3以其靜態(tài)結(jié)構(gòu)預(yù)測能力而聞名。然而,生物結(jié)構(gòu)的復(fù)雜性遠遠超出了靜態(tài)形式。女媧生物大結(jié)構(gòu)模型可以通過動態(tài)結(jié)構(gòu)生成技術(shù)模擬生物分子在微觀狀態(tài)下的動態(tài)變化。其動態(tài)精度比現(xiàn)有機器學(xué)習(xí)方法高50%,最多可實現(xiàn)32個時間點和256個序列長度。動態(tài)結(jié)構(gòu)預(yù)測,這一創(chuàng)新使模型能夠捕捉生物分子在不同時間和條件下的行為,為生物醫(yī)學(xué)研究提供更準確的數(shù)據(jù)支持。
此外,該模型還可以根據(jù)溫度、加速度、力等物理條件精確控制和預(yù)測生物結(jié)構(gòu)。它還能夠生成多種蛋白質(zhì)構(gòu)象,這有助于識別潛在的藥物結(jié)合位點,從而加速新藥的發(fā)現(xiàn)和開發(fā)。其中,基于擴散模型的蛋白質(zhì)多構(gòu)象采樣算法具有優(yōu)異的性能。與現(xiàn)有SOTA alphaflow算法相比,在精度基本相同的情況下,采樣多樣性提高了50%。
研發(fā)團隊的目標是創(chuàng)建一個能夠全面模擬生物結(jié)構(gòu)多樣性的模型,以輔助制藥工藝和藥物篩選。具有廣闊的未來應(yīng)用前景,特別是在生物醫(yī)學(xué)合成領(lǐng)域。有望通過模擬減少實驗需求,提高藥物研發(fā)效率。為生命科學(xué)研究和藥物開發(fā)帶來新的曙光。
簽署三項重要合作協(xié)議
推動科學(xué)化、智能化生態(tài)建設(shè)深入發(fā)展
尚志研究院與復(fù)旦大學(xué)、德勤咨詢(上海)有限公司、上海海洋大學(xué)、國家蛋白質(zhì)科學(xué)研究(上海)基地簽署三項重要合作協(xié)議,進一步推進和深化“1+1+N”建設(shè)“科學(xué)智能的生態(tài)系統(tǒng)。這些合作將整合多方資源,共同推動科學(xué)智能在金融、工業(yè)制造、生物科技、遠洋漁業(yè)等行業(yè)的創(chuàng)新應(yīng)用,推動人工智能與各行業(yè)的深度融合。
復(fù)旦大學(xué)、德勤咨詢(上海)有限公司和上海應(yīng)用技術(shù)大學(xué)簽署的三方合作協(xié)議,將在科學(xué)智能領(lǐng)域建立多層次的合作生態(tài)圈,為人工智能人才提供從教育到就業(yè)的全鏈條支持。實現(xiàn)人工智能在金融領(lǐng)域的應(yīng)用。在工業(yè)、健康管理、城市治理等領(lǐng)域的深度應(yīng)用。三方將聚焦人工智能、生命科學(xué)、智能制造等前沿領(lǐng)域科研突破,定期發(fā)布科學(xué)智能產(chǎn)業(yè)白皮書,共建高水平科學(xué)智能智庫和全鏈條對接平臺為產(chǎn)學(xué)研,為相關(guān)政策和產(chǎn)業(yè)發(fā)展提供前瞻。性建議。
上海海洋大學(xué)索菲亞科學(xué)技術(shù)研究院與國家蛋白質(zhì)科學(xué)研究(上海)裝置合作意向書將生物數(shù)據(jù)與人工智能緊密結(jié)合,為科學(xué)智能生態(tài)系統(tǒng)注入強勁動力。作為此次合作的核心,國家電投將通過戰(zhàn)略規(guī)劃和技術(shù)創(chuàng)新,推動生物數(shù)據(jù)處理和科學(xué)大模型的研發(fā)。國家蛋白質(zhì)科學(xué)研究裝置提供20萬余條生物大分子結(jié)構(gòu)數(shù)據(jù)和冷凍電鏡數(shù)據(jù)。基于此,雙方將重點攻克生物數(shù)據(jù)分析和智能算法應(yīng)用中的關(guān)鍵問題,推動生物數(shù)據(jù)的深度處理和智能化。突破性進展為生命科學(xué)技術(shù)創(chuàng)新和成果轉(zhuǎn)化提供有力支撐。
此外,上海海洋大學(xué)與上海應(yīng)用技術(shù)大學(xué)聯(lián)合成立“漁漁形勢校企智能海洋漁業(yè)聯(lián)合實驗室”,建立長期穩(wěn)定的產(chǎn)學(xué)研合作機制。上海海洋大學(xué)將向尚智所提供遠洋漁業(yè)等領(lǐng)域?qū)氋F的數(shù)據(jù)資源,尚智所將利用其在人工智能領(lǐng)域的先進技術(shù),特別是伏羲系列大型氣象模型進行深入分析處理這些數(shù)據(jù)。雙方將在數(shù)據(jù)共享、算法優(yōu)化、產(chǎn)品研發(fā)等方面開展深入合作,為近海漁業(yè)可持續(xù)發(fā)展提供前沿科技支撐。
第二屆科學(xué)智力競賽
完整獲獎名單公布
經(jīng)過三個月的選拔,第二屆科學(xué)智力競賽決賽于11月10日在徐匯西岸舉行,決出最終獲獎?wù)摺4筚愐钥茖W(xué)智能為風向標,秉承人工智能賦能千行萬業(yè)的理念,重點深入探索科技與行業(yè)前沿的5大賽道,匯聚科技新秀,共同推動科學(xué)智能的最高體現(xiàn)。 。
在本次賽事各參賽機構(gòu)的共同支持下,第二屆世界科學(xué)智力競賽規(guī)模更加龐大、更加多元化、更加年輕化、更加活躍。來自24個國家和地區(qū)1085家機構(gòu)的近13000名選手報名參賽,參賽作品數(shù)量較去年增長180%。參賽選手和團隊既有深耕行業(yè)多年的AI專家,也有在讀的學(xué)生。還有華師二附、私立平和、七寶中學(xué)、松江二中等14所頂尖高中的21所頂尖高中,由校長親自推薦。高中球員。
活動最后,進行了題為“物理世界AI大模型之路”和“o1之后AI將走向何方”的前沿對話。舉行。麻省理工學(xué)院教授、未來生命研究所創(chuàng)始人、《生命3.0》作者馬克斯·泰格馬克作為科學(xué)智能領(lǐng)域的重要科學(xué)家對本次論壇表示祝賀。
作文丨學(xué)校媒體中心
文丨尹孟浩 李毅杰 張寧杰
攝影丨程照尚之源
制圖丨徐勤鵬
主編丨張培琳
編輯丨張金玉