繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

英特爾鋭炫顯卡驅動升級,總經理高宇:輕薄本可跑160億參數大模型

2023-08-29 07:03

新浪科技訊 8月29日晚間消息,近日,英特爾宣佈旗下鋭炫顯卡迎來驅動重要升級。與此同時,通過軟件生態的構建和模型優化,英特爾正與PC產業夥伴合作推動生成式AI在輕薄本、全能本、遊戲本等消費終端的應用,致力於讓廣大用户在日常生活和工作中,也能通過AI的輔助來提高效率。

當前,一談到生成式AI,大家往往想到的是雲端運行,基於英偉達等企業的大型GPU運行。那麼,生成式AI能不能在PC端、輕薄筆記本上運行呢?在與新浪科技等媒體溝通中,英特爾中國區技術部總經理高宇給出了確定答案。

「肯定的,輕薄本也可以運營大模型,請大家拭目以待。」高宇表示。據他介紹,通過對模型優化,英特爾降低了模型對硬件資源的需求,進而提升了模型的推理速度,讓社區開源模型能夠很好地運行在個人電腦上。

以大語言模型為例,英特爾通過第13代英特爾酷睿處理器XPU的加速、low-bit量化以及其它軟件層面的優化,讓最高達160億參數的大語言模型,運行在16GB及以上內存容量的個人電腦上。

此外,基於OpenVINO PyTorch后端方案,英特爾可以通過Pytorch API讓社區開源模型運行在英特爾的客户端處理器、集成顯卡、獨立顯卡和專用AI引擎上。

以圖形視覺為例,由於集成了英特爾OpenVINO 工具包,Stable Diffusion實現的Automatic1111 WebUI,已經能通過上述方式,在英特爾客户端平臺的CPU和GPU(包括集成顯卡和獨立顯卡)上運行FP16精度的模型,用户可以在文字生成圖片、圖片生成圖片以及局部修復等功能上獲得良好的使用體驗。

在現場演示中,英特爾展示了接入Stable Diffusion及基於ChatGLM-6b、Llama 2-13b模型的運行結果。其中,ChatGLM-6b可以做到首個token生成first latency 241.7ms,后續token平均生成率after latency 55.63ms/token。同時Llama 2-13b則執行了更為複雜的中文與英文生成,在幾乎不影響閲讀速度的情況下,筆記本也能夠做到快速的生成效果。

一組由國外專業人士測評提供的數據顯示,將集成英特爾OpenVINO工具包的Stable Diffusion WebUI與英特爾Arc A770 16GB顯卡配合使用,可實現比未集成前54%的工作效率提升,在相同場景下,Arc  A750同樣實現了40%的提升。這一性能,已經超越了未集成OpenVINO工具包的英偉達RTX 4060顯卡,且A770 16GB也緊隨RTX 4060 Ti后。

據介紹,為適應當下快速發展的大語言模型生態,目前,英特爾已兼容了HuggingFace上的Transformers模型。已經驗證過的模型包括但不限於LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen等。此外,英特爾還提供了Transformers、LangChain等易用API接口,並支持Windows、Linux操作系統。

「隨着英特爾后續幾代產品進一步擴展,規模和數量的大幅增長將讓數億人輕松享受AI加速體驗,並實現更優的智能協作、更快的處理速度和更強的功能特性實現前所未有的體驗變革。」英特爾表示。

生成式AI外,英特爾還通過對Game On驅動的升級發佈,提升了鋭炫顯卡在運行一系列DirectX 11遊戲的性能,為用户帶來平均約19%的幀率提升,平均約20%的99th Percentile幀率流暢度提升。

此外,為幫遊戲開發者、發燒友們更好地瞭解遊戲運行及相關軟硬件資源使用情況,英特爾還升級發佈了名為「PresentMon」的工具,幫助衡量和評估系統性能,並根據個人需求進行優化。目前PresentMon首個Beta測試版已經放出,適用於評估所有 GPU廠商,並且可以在DirectX 9、11、12和Vulkan 上運行。

據介紹,自臺式機顯卡發佈以來,英特爾已累積發佈30次驅動更新,為57款新遊戲提供發售首日(Game on)優化支持。由AI驅動的英特爾XeSS技術,現已獲得超過70款遊戲的支持。 (文猛)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。