2022年05月17日--Hewlett Packard Enterprise(NYSE: HPE)宣布推出HPE群體學習(HPE Swarm Learning)創新AI解決方案,加速從前端資料獲得所需的洞察。從病人疾病診斷資料到防詐騙偵測前端信用卡交易資料等應用,讓客戶在不侵犯資料隱私的情況下,跨地點或組織共享與統合AI模型的學習內容。
圖說1:HPE群體學習解決方案(Swarm Learning),讓使用者共享AI在前端或分散式資料的學習內容,不損害個別的資料隱私權。
由HPE研發單位惠普實驗室開發的HPE群體學習解決方案,是業界第一個能保護資料隱私的分散式機器學習架構1。這個專為前端與分散式資料設計的解決方案,提供客戶透過HPE群體學習API,可輕鬆整合AI模型,使用者可以立即與組織內部同仁以及外部組織共用AI模型的學習內容,提升訓練成效,而不需要共用實際的資料。
HPE執行副總裁暨HPC與AI部門總經理Justin Hotard表示,「群體學習是強大的AI創新技術,並已在全球應用需求上取得了進展,例如提升病患醫療保健、改善異常偵測,以及協助偵測詐騙行為和預測性維護」,「HPE讓群體學習取得更重大的發展,藉由HPE的企業級解決方案,企業組織可以在各自的倫理規範、資料隱私要求與公司治理標準下進行合作與創新,並加速運用AI模型的能力。」
影片:大轉變:什麼是群體學習?
導入創新AI方法,安全運用前端資料的洞察
今日大多數的AI模型訓練都需要依靠集中整合多源資料在單一地點進行,使用者需要搬移大量資料至同一個資料中心,不僅缺乏效率又相當昂貴。這種做法也受限於資料共享與移動產生資料隱私與所有權規則與規範的限制,易導致不精準或有偏差的模型出現。藉由在前端訓練模型並從前端獲得洞察力,企業組織可以在關鍵時刻更快做出決策,並獲得更佳的使用體驗與成效。也可讓不同企業組織在不同資料來源間分享學習內容,也能促進各產業的合作並改善智慧化能力,進而創造出優異的商業與社會成果。
圖說2:HPE群體學習解決方案(Swarm Learning)運作過程。
在資料治理、法規或合規性的要求下,企業必須強制將資料留在內部,因此與外界共享資料可能會對企業造成挑戰。HPE群體學習解決方案能讓企業在資料來源的位置,使用分散式資料建立可以公平學習的機器學習模式。這樣一來,不僅能增加訓練所需的資料集,還能符合資料治理與隱私要求。為確保只共用前端的學習內容而非資料本身,HPE群體學習解決方案使用區塊鏈技術,可以安全加入成員、在成員中動態選擇領導者,並匯集模型參數,讓群體學習網路具備彈性復原力與安全性。由於HPE群體學習解決方案只能共享學習內容,因此使用者可以利用大量的訓練資料集而不用擔心違反隱私要求,同時降低偏差並提升模型的準確性。
將資料「群體化」促使AI創造更大效益
HPE群體學習解決方案能強化各行各業企業組織的合作,並提升洞察力:
• 醫院可以從影像紀錄、CT與MRI掃描和基因表現資料與其他醫院共享的學習內容,改善疾病診斷結果並保護病患資料。
• 銀行與金融服務業者可以同時與多家金融機構共享詐騙相關的學習內容,避免未來10年2信用卡詐騙造成全球超過4000多億美元的損失。
• 製造業可以利用預測性維護,事先掌握設備維修需求,並在設備故障導致不必要的停機前解決問題。透過群體學習,維修人員可以從各工廠的感測器資料收集學習內容,以獲得更精準的洞察力。
以下是採用HPE群體學習解決方案的使用案例:
亞琛工業大學研究組織病理學,加速大腸癌診斷
德國亞琛工業大學附屬醫院的癌症研究團隊進行了一項研究,在影像處理過程中運用AI技術來預測會導致正常細胞轉變成癌細胞的基因改變,以加速診斷出大腸癌。
研究員對三組來自愛爾蘭、德國和美國的病患,使用HPE群體學習解決方案來訓練AI模型,並對兩個來自英國的獨立資料集使用相同群體學習訓練的AI模型,並以此來驗證預測結果。結果顯示,使用群體學習的AI模型勝過只使用當地資料訓練的原始AI模型,因為群體學習只與其他單位共用學習內容而非病患資料,因此能提昇預測結果。
TigerGraph迅速偵測異常狀況,幫助銀行打擊信用卡詐騙的犯罪行為
圖形分析平台領導廠商TigerGraph將HPE群體學習解決方案與該公司的資料分析工具結合,以迅速偵測異常的信用卡交易狀況。該公司採用AMD EPYC處理器的HPE ProLiant伺服器進行資料分析。這個整合解決方案使用全球各地多家銀行與分支機構提供的大量金融資料來訓練機器學習模型,讓模型達到更高的精準度。
產品訊息
HPE提供完整且可立即使用的機器學習開發解決方案
HPE發布新HPE機器學習開發系統(HPE Machine Learning Development System),讓企業組織更容易大規模建立與訓練機器學習模型,進而加速創造價值。這個專為AI設計的系統是整體解決方案,並整合機器學習軟體平台、運算資源、加速器和網路連線功能,讓客戶更快開發與訓練大量更準確的AI模型。
1. 截至2022年4月13日為止,針對宣稱可保護資料隱私的競爭產品所做的分析,結果顯示這類產品皆為(i)需要使用中央伺服器的聯邦學習架構,或是(ii)使用區塊鏈技術但不支援企業應用的解決方案。
2. 未來10年信用卡詐騙將造成全球4085億美元的損失。資料來源:尼爾森報告,2021年12月