繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

推動AI繪畫獨角獸Stability AI全球走紅,亞馬遜登頂IDC報告

2023-02-02 09:24

日前,IDC發佈了《2022年亞太地區(不含日本)AI生命周期軟件工具和平臺供應商評估》報告,在其評估的供應商中,亞馬遜雲科技憑藉機器學習旗艦產品Amazon SageMaker的功能、交付能力以及在開源方面的優勢,被IDC列入「領導者」陣營,並居於圖中最高最遠位置。

來源:IDC MarketScape:2022年亞太地區(不含日本)AI生命周期軟件工具和平臺供應商評估。IDC,2022

IDC MarketScape評估模型通過綜合考量廠商在產品、服務、能力和策略等方面的表現能力及競爭力,對特定市場進行定量和定性評估。研究報告以清晰易讀的圖形進行總結,為行業用户及IT廠商制定技術決策提供必要信息。如上圖所示,報告中,亞馬遜雲科技在能力和戰略兩個維度都獲得最高分,在以圓圈為代表的市場份額方面,亞馬遜雲科技也位居前列。

亞馬遜雲科技參與評估的解決方案Amazon SageMaker可為客户的數據準備、模型構建、訓練、評估、部署、MLOps和可信度提供端到端的完全託管服務,為企業的整個機器學習生命周期提供支持。IDC報告指出,憑藉在功能和產品、服務交付和增長方面的優勢,Amazon SageMaker成為亞馬遜雲科技增長最快的雲服務之一。

以AI繪畫走紅全球的新晉獨角獸公司Stability AI,去年推出了開源AI模型Stable Diffusion。藉助這一模型,任何人只需要提供一段文字描述,就有機會創作出任意風格的繪畫作品。Stable Diffusion自2022年8月推出以來,已經被全球超過20萬開發者下載和授權。Stability AI的消費級產品DreamStudio註冊用户來自全球50多個國家,已經超過100萬,他們共同創建了超過1.7億張圖像。

Stable Diffusion這樣的模型訓練起來非常困難,需要使用數千個GPU或Amazon Trainium機器學習訓練專用芯片。Stability AI 選擇亞馬遜雲科技作為首選雲提供商。通過使用 SageMaker 託管的基礎設施和優化庫,Stability AI能夠使其模型訓練具有更高韌性和性能。例如對於 GPT NeoX 等模型,Stability AI 使用 SageMaker 及其模型並行庫將訓練時間和成本減少 58%,同時,這些優化和性能改進適用於具有數百或數千億參數的模型。

Amazon SageMaker旨在打破機器學習的壁壘,推進前沿技術的普惠化,把機器學習能力真正從研究實驗室交到企業手中,亞馬遜雲科技在2017年 re:Invent 全球大會上首次推出。Amazon SageMaker由十幾種工具組成,包括SageMaker Data Wrangler、SageMaker Studio、SageMaker Autopilot、SageMaker Canvas和SageMaker Clarify等,並不斷根據客户需求推出新的功能和特性。

亞馬遜雲科技近年來一直在Amazon SageMaker套件中快速推出新功能和特性。在過去的六年時間里,亞馬遜雲科技為其增加了超過290項新的功能和特性,包括調試器 (SageMaker Debugger)、模型監視器 (SageMaker Model Monitor)、剖析器(SageMaker Clarify)、AutoML (SageMaker Autopilot)、特徵商店(SageMaker Feature Store)、無代碼功能 (SageMaker Canvas),以及第一個專門用於機器學習持續集成和持續交付(CI/CD)的工具,使機器學習在雲端和邊緣設備上變得更為簡便,可擴展性更強。

這些功能和特性往往秉承開源特色,體現出強大的工程靈活性,支持快速交付和部署,可以有效支持用户的規模化推理,具有良好的性價比,可以為用户帶來數據引力和規模經濟等好處。

據此,IDC推薦具有構建者/開發者文化的企業、致力於以相對較小規模團隊或較低運營成本來擴展ML/DL模型的企業,以及重視技術支持質量和及時性的企業使用Amazon SageMaker。

過去,從事機器學習需要專門技能,通常由數量有限的開發人員、研究人員或以機器學習為主要業務的公司所有。開發人員和數據科學家必須首先將數據可視化、轉換和預處理為算法可用訓練模型的格式,涉及大量的算力、漫長的訓練周期,並需要設立專門的團隊來管理環境。這些環境通常跨越多個支持GPU的服務器,以及需要大量的人工性能調整。

此外,在應用程序中部署經過訓練的模型需要一套不同的應用程序設計和處理分佈式系統的專業技能。隨着數據集和變量的增加,新信息的出現,舊模型變得不再可用,企業不得不重複上述過程。這導致除了資金充足的企業和研究機構外,大多數人都無法接觸到機器學習。

為此,Amazon SageMaker推出了全球首個用於機器學習的集成開發環境(IDE),使開發人員、數據科學家和商業分析師能夠快速、輕松地準備數據,並在規模上構建、訓練和部署高質量的機器學習模型,例如Amazon SageMaker Canvas為沒有機器學習經驗的商業分析師提供的無代碼環境。Amazon SageMaker Studio Lab為學生提供無需設置、不收費的機器學習環境,讓他們能夠更快地學習機器學習技能。

最近,亞馬遜雲科技在2022 re:Invent全球大會上宣佈Amazon SageMaker 推出八項新功能,包括:新的 Amazon SageMaker 機器學習治理功能可以在整個機器學習生命周期中提供對模型性能的可見性;新的 Amazon SageMaker Studio Notebooks 功能提供了增強的Notebooks體驗,讓客户只需點擊幾下即可檢查和解決數據質量問題,促進數據科學團隊之間的實時協作,通過將Notebooks代碼轉變到自動化作業加速機器學習實驗到生產的過程;Amazon SageMaker Geospatial ML 讓地理空間數據處理變得更容易等等。

此次發佈的新功能讓團隊能夠更輕松地協同機器學習模型的端到端開發和部署,將數據擴展到地理空間,幫助客户大規模利用機器學習,並更好地進行機器學習相關的模型治理。

LG人工智能研究院最近推出了由超大「人工智能語言模型」EXAONE驅動的人工智能藝術家Tilda。Tilda可以處理2.5億個高清圖像-文本對數據集,並且通過多模態人工智能創造全新的圖像。Amazon SageMaker的擴展和分佈式訓練能力,在開發EXAONE時發揮了至關重要的作用。訓練Tilda這樣的超大模型需要海量計算,高效的並行處理至關重要,此外,對大規模數據實現可持續管理,靈活處理新獲取的數據也是必要條件。LG人工智能研究院通過使用Amazon SageMaker訓練模型和分佈式訓練庫,在未對訓練代碼進行重大修改的情況下,訓練模型的速度提高了59%。

香港職業教育學院的IT部門使用Amazon SageMaker Studio Lab為學生提供參與真實世界機器學習項目的機會,而不會被設置或配置所困住,從而能做更多的編碼練習。在基礎機器學習和Python相關的課程中使用Amazon SageMaker Studio Lab可以為學生在多項雲技術方面打下堅實基礎。 

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。