兩項對十億級數量原子的模擬結果,兩項對新冠病毒 (SARS-CoV-2) 的感染途徑所提出的新見解,以及一個加速藥物發現的全新人工智慧 (AI) 模型。
四個研究團隊以上述的研究成果,入圍了被視為高效能運算領域諾貝爾獎的戈登貝爾獎 (Gordon Bell Awards) 決賽。研究團隊利用 AI、加速運算或二者兼具,運用 NVIDIA 的技術推動科學發展。
入圍新冠病毒研究特別獎決賽的團隊,利用 AI 將多個模擬資料串連起來,以更上一層樓的清晰度,展示了病毒如何在宿主體內複製。
這項由阿貢國家實驗室 (Argonne National Laboratory) 的運算生物學家 Arvind Ramanathan 帶領進行的研究,能夠提高用於探索蛋白質結構的傳統工具解析度,或許能為遏止病毒傳播提供新的見解。
這個團隊由數十個來自英美兩國的組織組成,他們設計了一個能夠跨系統運作的工作流程,包括由慧與科技 (Hewlett Packard Enterprise;HPE) 製造、搭載 NVIDIA A100 的 Perlmutter 超級電腦,以及阿貢國家實驗室的 NVIDIA DGX A100 系統。
在這篇論文中寫道:「整合生物學是否能進行多站點資料分析和模擬的能力,對利用難以轉移的大型實驗資料來說是非常寶貴的。」
該團隊在研究活動中發展出一項技術,利用 GPU 上熱門的 NAMD 程式加速推動分子動力學的研究。他們還利用 NVIDIA NVLink 來提高資料的傳輸速度,「遠遠超過目前傳統高效能運算網路互連技術或是 PCIe 傳輸技術所能達到的速度。」
用極為逼真的畫面模擬十億個原子
南佛羅里達大學的物理學教授 Ivan Oleynik 領軍的團隊,以首個高精度十億個原子模擬畫面,入圍了戈登貝爾獎標準獎項的決賽。它以 23 倍的速度打破了去年戈登貝爾獎得主所締造的紀錄。
Oleynik 表示:「發掘出從未見過的現象是一大樂事,這是我們非常自豪的一項重大成就。」
模擬極端溫度和壓力下的碳原子,或許能為新能源打開大門,也能讓我們瞭解遙遠星球的構成。這個驚人的模擬結果達到量子等級的精準度,忠實反映出原子之間的作用力。
Oleynik 表示:「我們只有在強大的 GPU 超級電腦上,使用機器學習技術才能達到這般精確度,AI 將為科學開展帶來一場革命。」
該團隊發揮美國能源部 Summit 超級電腦 4,608 台 IBM Power AC922 伺服器,以及 27,900 個 NVIDIA GPU 的強大運算能力,Summit 超級電腦由 IBM 負責建造,是全球最強大的超級電腦之一。它證明了該團隊的程式碼,能夠以幾乎 100% 的效率擴大到模擬 200 億個以上的原子。
想要突破材料科學界限的研究人員,都能取得這個程式碼。
在致命的飛沫裡面
第二個入圍新冠病毒特別獎決賽的團隊,利用另一個十億個原子的模擬內容,展示了空氣飛沫裡的 Delta 病毒變體 (如下圖)。其揭示了生物傳播新冠肺炎及其他疾病的力量,首次以原子級的程度對氣溶膠進行觀察。
在去年的特別獎得主、加州大學聖地牙哥分校研究員 Rommie Amaro 帶領之研究團隊所發表的論文中,提到這項研究成果「對深層肺部的病毒結合,以及對其他空氣傳播病原體的研究,具有深遠的影響」。
圖_由 Amaro 帶領的團隊以超過十億個原子,模擬呼吸道飛沫中的新冠病毒 Delta 變種。
Amaro 表示:「我們展示了 AI 如何在多個層面上搭配高效能運算,進而大幅改善有效性,以便用新的方法去理解和審視複雜的生物系統。」
研究人員運用 Summit 超級電腦上的 NVIDIA GPU,以及戴爾科技 (Dell Technologies) 為德州先進運算中心及甲骨文 (Oracle) 雲端商用系統打造的 Longhorn 子系統。
該團隊在結論中寫道:「高效能運算與雲端資源能夠顯著縮短解決重大科學問題的時間,以及串連研究人員進行複雜的合作互動。」
藥物發現的語言
入圍新冠病毒特別獎決賽的橡樹嶺國家實驗室 (Oak Ridge National Laboratory;ORNL) 團隊,將自然語言處理 (NLP) 技術用於解決篩選新藥化合物的問題。
他們使用內有 96 億個分子的資料集,迄今用於這項任務最龐大的資料集,在 2 小時內訓練出一個可以加速發現新藥的 BERT NLP 模型。過去的最佳成績是花了四天,用有 11 億個分子的資料集來訓練一個模型。
這項研究工作在 Summit 超級電腦上,用了超過 2.4 萬個 NVIDIA GPU,提供高達 603 petaflops 的運算能力。完成訓練的模型可以在單一 GPU 上運行,幫助研究人員找到能夠抑制新冠肺炎和其他疾病的化合物。
橡樹嶺國家實驗室的運算科學家 Jens Glaser 表示:「我們這裡的合作者想將該模型用於研究癌症訊息傳遞路徑。」
帶領該團隊的研究科學家 Andrew Blanchard 表示:「我們只是粗淺地探討了訓練資料的大小,希望很快能使用有 1 兆個分子的資料集進行研究。」
仰賴全堆疊解決方案
該團隊使用 NVIDIA 的 AI 和加速運算軟體函示庫,在一名觀察員所說的極短時間內完成了工作。
Glaser 表示:「我們不用對 GPU 的 Tensor 核心完全最佳化調整研究工作內容,不需要專門的程式碼,直接用標準的堆疊就行了。」
他總結了許多決賽選手的感受:「科學家有機會進行別具意義的研究,對人們的生活產生潛在影響,這樣就滿足了。」
歡迎觀看 NVIDIA 於台灣時間 11 月 16 日在 SC21 大會直播的特別演講。