熱門資訊> 正文
2025-12-02 08:06
大夥有沒有覺得,2025年的科技圈雖然熱鬧,但總覺得少了點什麼?
回頭看看這一年,AI大模型那是遍地開花。Sora生成的視頻已經能以假亂真,GPT-5據說智商已經趕超人類平均水平,就連咱們國內的豆包、千問和DeepSeek也是卷得飛起。
但是,兄弟們發現沒有,這些所謂的高科技,好像大多還停留在電腦網頁里,或者作為一個聊天App躺在咱們手機里。
回到咱們每天用得最多的手機上,情況好像沒啥大變化。你還得一個個點擊App圖標,還得在微信、淘寶、小紅書之間切來切去。那些大模型吹得天花亂墜,結果你想點個外賣,還是得自己動手劃屏幕。
就在大夥都以為2025年就要這麼平平淡淡結束的時候,字節跳動這邊卻突然搞了個大新聞。
12月1日,字節跳動發佈了豆包手機助手預覽版。
(圖源:豆包)
簡單來説,這是一個面向手機廠商的系統級服務,它將豆包大模型深度融入操作系統,讓用户只需動嘴(或動一下手指),就能指揮手機去執行那些原本需要點擊幾十次屏幕的繁瑣操作。
遺憾的是,咱們雷科技這次還真沒提前拿到產品,我對那臺中興工程樣機其實還挺感興趣的。
不過,這倒也不影響我們帶大夥一起看看,豆包的背后到底有多少料就是了。
先給不明真相的吃瓜羣眾科普一下,微博上今天炒作得沸沸揚揚的「中興將和豆包推出AI原生手機」的消息,屬於典型的以訛傳訛。
這次豆包發佈的並不是一款手機,而是搭載在nubia M153上的手機助手。
(圖源:豆包)
看到這個組合,估計很多讀者會覺得奇怪:字節跳動為啥不自己做手機?
這事兒...咱們后面細説。
言歸正傳,根據官方發佈的演示視頻,豆包手機助手最大的賣點就四個字:全權代勞。
咱們現在的手機助手,比如Siri或者小愛同學,你讓它定個鬧鍾、查個天氣還行。但如果你説:幫我給微信里的老王發個紅包,順便把剛纔拍的照片發給他。
這時候,絕大多數手機助手都會傻眼,或者直接給你打開微信就完事了,剩下的還得你自己操作。
但豆包這個助手不一樣。
在演示里,測試人員對着手機說了一句:「幫我把這瓶洗發水,在我所有的購物軟件上比個價,選個最便宜的下單。」
(圖源:豆包)
只見手機屏幕自己動了起來,它自動進行了識圖,在提取商品名之后,依次前往淘寶、京東、拼多多進行產品搜索和比價,最后會停在支付頁面上,請求用户進行手動支付。
整個過程,測試人員的手完全沒有碰屏幕,全程耗時3分12秒。
這就有點離譜了。
要知道,這涉及到跨App操作。豆包手機助手不僅要聽懂你的話,還得認識屏幕上的按鈕哪個是產品、哪個是查詢,還得能模擬手指點擊,像人一樣去操作手機中的應用。
這在技術圈里叫GUI Agent,翻譯過來就是圖形界面智能體,就是給AI裝了一雙眼和一雙手。
還有一個場景讓我印象深刻。
測試人員戴着智能耳機Ola Friend,正忙得騰不出手,他直接用語音喚醒豆包説:「幫我看一下博客平臺的周刊欄目,這周更新了沒,要是更新了,幫我放到播放列表,我一會路上要聽。」
(圖源:豆包)
手機立刻就能在鎖屏的情況下,進行任務的操作。
即便在這時候,測試人員提出了新的需求:打開特斯拉的前備箱、在西班牙餐廳提前訂座,也不會影響之前的任務,多個任務可以直接並行運轉。
像這樣的功能,在那些手忙腳亂的時刻特別好用。
基礎功能嘛,文字交互、語音通話、視頻通話與屏幕共享功能都有,多模態生成與手機原生相冊深度融合,輕松去除照片中的人與雜物,保留純淨風景。
(圖源:豆包)
這還沒完,豆包手機助手的全局記憶纔是我覺得未來對手機系統交互影響最大的能力。
測試人員舉例,在操作手機Pro模式下,當用户説「幫我給女兒推薦幾個禮物放進購物車」時,若記憶中已存儲女兒的年齡、興趣等信息,助手可直接查詢符合女兒年齡、偏好的方案,無需用户逐一交代細節。
這感覺,可以説比你自己還了解你自己。
當然,官方在視頻末尾也強調了,儘管演示內容均為真實錄制,但受限於大模型技術的不確定性,相關場景無法保證百分百復現。
至於價格嘛,因為目前還是技術預覽版的工程機,這台搭載豆包手機助手的nubia M153售價定在了3499元。
這價格,放在2025年的旗艦機市場里不算貴。但考慮到它主要是給開發者和極客嚐鮮的,普通用户買回去可能會遇到不少BUG,后續系統更新也有待觀察,所以大夥還是看看就好,別衝動消費。
聊完產品,咱們來聊聊背后的邏輯。
很多兄弟可能會問:這功能聽起來很爽,但為啥小米、華為這些大廠不直接做?非得字節跳動來做?
其實,這就是術業有專攻的問題。
咱們之前也聊過,小米的小愛同學、華為的小藝,它們雖然也在進化,但本質上它們是守門員。
手機廠商做AI,第一要務是穩。不能爲了智能把手機搞發燙了,也不能讓AI隨便亂點用户的應用,萬一給老闆發錯消息豈不是社死?
所以大廠的AI往往比較保守,主要通過接口(API)來控制App,這就導致支持的應用有限,操作起來體驗也很固化。
而字節跳動做豆包,那就是純純的進攻型選手。
豆包背后的大模型,擁有原生的多模態處理能力,腦子非常靈光。它不需要App專門給它開后門,它是直接像人一樣看屏幕,然后模擬人操作手機的邏輯來工作,因此限制會小很多。
從提前上手的老師那里,你甚至能看到豆包自己玩微信小遊戲的視頻。
這種技術路線非常激進,容錯率低,但上限極高。
那問題來了,為什麼字節不自己造手機呢?
這就涉及到一段互聯網往事了。當年錘子手機賣給字節后,字節其實嘗試過做硬件,但結果大夥也知道了,而現在的手機市場更是紅海中的紅海,新玩家根本進不去,那字節顯然也沒有啥必要自討苦吃。
所以,字節選擇了「借殼上市」。
它需要一個硬件載體來落地它的AI能力,而對於中興/努比亞這樣的二線手機品牌來説,硬件沒毛病,系統體驗卻一直是被用户吐槽的短板。
這倆一拍即合,努比亞提供硬件和系統底層權限,字節提供超級大腦,完美。
事實上,這也給行業提供了一個新思路:靠AI翻身。
你想想,如果魅族、摩托羅拉這些市場份額不大的品牌,突然換上了比主流廠商更聰明的豆包手機助手,能自動幫你點外賣、搶火車票、自動修圖發朋友圈,你會不會心動?
我覺得,至少有一部分極客會買單。
看完豆包這一波操作,小雷我不禁感慨,互聯網真是一個圈。
老網民應該還記得,十年前,也就是2012年到2014年左右,那是各種手機ROM滿天飛的時代。
那時候,騰訊做過TOS,阿里做過雲OS,百度也做過百度雲OS,甚至Facebook都做過Facebook Home。可以説幾乎所有的巨頭,都想通過做一個手機系統,把自己的服務塞進去,以此搶佔移動互聯網的入口。
你還真別說,當時雷科技也做了不少評測。
結果呢?全軍覆沒。
因為那時候的第三方系統,除了換個皮膚、預裝幾個全家桶App之外,並沒有給用户帶來核心的體驗提升,甚至會因為塞的功能太多,導致操作手冊複雜,最后因為適配差、卡頓而被拋棄。
現在,十年過去了,劇本好像又重演了。
只是這一次,武器從UI(界面)變成了AI(智能)。除了谷歌,字節跳動、OpenAI以及各路大模型廠商,似乎都在試圖搶佔手機這個入口。
但這次,成功的概率可能比十年前要大。
因為AI是真的能省事。
(圖源:豆包)
如果一個手機助手能讓我每天少點幾百次屏幕,能幫我自動處理掉那些繁瑣的訂票、比價、填表任務,我是願意忍受它偶爾的小Bug的。
最重要的是,這對於手機行業來説,可能是一場降維打擊。
它可能不會立馬改變格局,畢竟小米、華為、蘋果的地位難以撼動。但它撕開了一道口子,告訴我們:未來的手機,不應該只是一個搭載了AI功能的通訊工具,而應該是一個能幫你解決問題的智能助手。
説不定到了2026年,咱們再聊起手機,問的不再是「你這手機拍照多少像素」,而是「你這手機能不能幫我把那些破事給做了」。
那樣的話,這世界可就太美好了。
本文來自微信公眾號「雷科技」,作者:雷科技,36氪經授權發佈。