當前位置： 主頁 > 新聞 >

甲骨文推出Oracle雲端資料科學平台

本文作者：甲骨文點擊： 2020-03-12 11:22

前言：

2020年3月12日--甲骨文近日發佈Oracle雲端資料科學平台(Oracle Cloud Data Science Platform)。該平台的核心服務為Oracle雲端基礎設施資料科學平台(Oracle Cloud Infrastructure Data Science)，旨在幫助企業以合作方式建立、訓練、管理和部署機器學習模型，提高資料科學專案的成功率。與其他專注在資料科學家個人使用的產品不同，Oracle雲端基礎設施資料科學平台提供共用專案、模型目錄、團隊安全性政策、可重現性和可稽核性等功能，協助資料科學團隊提高效率。此外，Oracle雲端基礎設施資料科學平台可以透過AutoML演算法選擇和優化、模型評估與說明等功能，自動選擇最佳的訓練資料集。

目前，多數企業僅從資料的巨大潛能中挖掘出一小部分，這是因為他們的資料科學團隊仍無法輕鬆使用適當的資料和工具來建構、部署有效的機器學習模型，導致模型開發時間過長，難以滿足企業對準確性和可靠性的更高需求，因而無法投入生產。

甲骨文資料和AI服務產品開發資深副總裁Greg Pavlik表示：「有效的機器學習模型是資料科學專案取得成功的基礎，但不同類型的大量資料會阻礙專案的執行。使用Oracle雲端基礎設施資料科學平台，讓我們將整個工作流程自動化並建立強大的團隊合作支援，以此提高各資料科學家的效率，確保資料科學專案為企業創造真正的價值。」

專為資料科學團隊和科學家量身打造

Oracle雲端基礎設施資料科學平台提供自動化的資料科學工作流程，透過下列功能節省時間並減少錯誤：

• AutoML自動演算法選擇和優化 — 可針對多種演算法和超參數配置，自動運行測試過程。這項功能可以檢查結果的準確性，並確認目前選擇的模型和配置是最佳方案。不僅可以為資料科學家節省大量時間，更重要的是，能夠賦予不同水準的資料科學家專家級的能力。

• 自動選擇預測性特徵 — 透過自動辨認大型資料集裡的關鍵預測性特徵，從而簡化特徵工程。

• 模型評估 — 生成一整套評估指標和適當的視覺化工具，以便針對新資料來衡量模型效能，並且可以持續對模型進行排序，在生產環境中採取最佳行為。除了原始效能之外，模型評估還將考慮預期的基準線行為(baseline behavior)，並運用成本模型將誤報和漏報的不同影響計算其中。

• 模型說明 — 針對預測中的影響因素，Oracle雲端基礎設施資料科學平台可對它們的對應權重和重要性提供自動說明。Oracle雲端基礎設施資料科學平台首次提供了商業化、與模型無關的說明。舉例來說，藉助詐欺檢測模型，資料科學家可以解釋哪些因素是詐欺的最大動因，以便企業修改流程或實施保護措施。

眾所皆知，要將有效的機器學習模型成功投入生產，僅憑一人之力是無法實現的，這需要多個資料科學家合作完成。Oracle雲端基礎設施資料科學平台提供強大的團隊合作功能，包括：

• 共用專案 — 幫助使用者安排、啟用版本控制並可靠地共享團隊工作內容，包括資料和筆記本(notebook session)。
• 模型目錄 — 使團隊成員可靠地共享已經建構的模型，以及那些修改和部署它們所需的製造物。
• 針對團隊的安全功能 — 允許使用者控制對模型、代碼和資料的存取權限，這已經與Oracle Cloud Infrastructure Identity and Access Management全面整合。
• 可重現性和可稽核性功能 — 支持企業追蹤所有相關資產，即便成員離開團隊，企業也可以複製和稽核所有模型。

藉助Oracle雲端基礎設施資料科學平台，企業可以提高部署模型的速度和成功率，產生企業級結果和效能指標來進行預測分析，從而取得正面的業務成果。

全面的資料服務和機器學習服務
Oracle雲端資料科學平台包含七項新服務，提供全面的端對端體驗去加速與優化資料科學成果。這七項新服務為：

• Oracle雲端基礎設施資料科學平台：支援用戶使用Python以及其他開源工具和函式庫(包括TensorFlow、Keras和Jupyter)在Oracle雲端上建立、訓練和管理新的機器學習模型。

• Oracle自主資料庫新增的機器學習功能：機器學習演算法緊密整合在Oracle自主資料庫中，並新增了對Python和AutoML的支持。接下來，這些演算法將與Oracle雲端基礎設施資料科學平台整合，支援資料科學家使用開源和可擴展的資料庫中(in-database)演算法來開發模型。這種將演算法應用於Oracle資料庫中資料的獨特方法可減少資料的準備和移動的工作，從而加速實現成果。

• Oracle雲端基礎設施資料目錄：允許使用者在Oracle雲端上發掘、查詢、安排、強化和追蹤資料。Oracle雲端基礎設施資料目錄採用內建業務術語表，用戶可輕鬆管理和找到合適的可靠資料。

• Oracle大數據服務：提供完整建置的Cloudera Hadoop，與其他Hadoop產品相比，該服務大幅簡化管理，只需一鍵即可使群集具有高可用性與安全性。Oracle大數據服務還包含適用於Spark的機器學習，企業可以使用一個產品在記憶體中運行Spark機器學習，盡可能減少資料移動。

• Oracle Cloud SQL：支援對HDFS、Hive、Kafka、NoSQL和物件儲存中的資料進行SQL查詢。CloudSQL的獨特之處在於，與Oracle資料庫進行對話的任何使用者、應用或分析工具，都可以自由地使用其他資料儲存中的資料，獲得下推(push down)、橫向擴展(scale-out)處理的優勢，可最大程度地減少資料移動。

• Oracle雲端基礎設施資料流程：完全託管的大數據服務，使用者無需部署或管理基礎設施即可運行Apache Spark應用，從而幫助企業更快地取得大數據和AI應用程式。與其他Hadoop和Spark服務不同，Oracle雲端基礎設施資料流程提供了單一窗口追蹤所有Spark作業讓高成本任務可以輕鬆辨識、排除問題。

• 適用於資料科學的Oracle雲端基礎設施虛擬機器：以GPU為基礎的預設環境，具有常見的IDE、notebook和框架，可以在15分鐘內啟動並運行，每天收費30美元。

來自客戶的評價
AgroScout是一家致力於檢測農作物早期病害的軟體公司，幫助農民提高農作物產量、減少農藥使用並增加利潤。AgroScout創始人兼執行長Simcha Shore表示：「我們的願景是讓全球5億個農場中的10億農民，也就是全球30%的勞動力，能夠以經濟合理的方式使用現代農業技術。我們計畫透過AI驅動的雲端可持續農業技術來實現這一目標，這只要依靠低成本無人機、手機和農民的手動輸入。要成功達成這一願景，就必須做到兩點：管理好持續不斷增長的資料流程，以AI為基礎的解決方案將資料轉變為精準決策，產生規模化效應。Oracle雲端在速度、擴展能力和敏捷性上的優勢幫助我們實現了夢想。如今，新推出的Oracle雲端基礎設施資料科學平台為我們開闢了新的可能性，讓我們的資料科學家能夠以合作方式建立、訓練和部署機器學習模型。這進一步幫助我們降低了成本，提高了效率，從而更快地拓展全球業務。」

IDenTV是一家提供以AI功能為基礎的高級影片分析技術公司，包括電腦視覺、自動語音辨識和文本語義分類工具。IDenTV創始人兼執行長Amro Shihadah表示：「藉助Oracle雲端基礎設施資料科學平台，我們成功擴展了資料科學工作，以前所未有的速度創造業務價值。如今，我們的資料科學團隊可以無縫取得資料，無需擔心資料位置或存取機制的複雜度。利用環境中嵌入的TensorFlow、Keras和Jupyter Notebooks等開源功能，我們可以簡化模型訓練和部署任務，從而節省大量成本，以更快的速度獲得結果。 Oracle雲端基礎設施資料科學平台和Oracle自主資料庫説明我們在市場上增強競爭力，建立獨特的優勢。」

關於甲骨文
Oracle雲端服務在銷售、服務、市場行銷、人力資源、財務、供應鏈和製造領域提供全面的集成應用，以Oracle自主資料庫為基礎打造的具有高度自主能力和安全性的第二代基礎設施。如需瞭解更多關於甲骨文公司(NYSE: ORCL)的資訊，請連結至www.oracle.com和www.oracle.com/tw。

本月熱點 HOME

欄目熱點 HOME