熱門資訊> 正文
2026-02-27 09:45
當 AI 開始尋找自己的形狀,有些選擇出人意料。
AI 在智能手機上生出了一顆獨立按鍵,似乎讓智能手機找回了久違的進化動力。眼鏡憑藉着視覺和聽覺的天然入口,隱隱有了下一代個人終端的影子。一些小而專注的設備,在某些瞬間似乎比 All in one 的設備更為可靠。與此同時,那些寄望一次性替代手機的激進嘗試,卻遭遇了現實的冷遇。
技術的落地,從來不只是功能的堆疊,更關乎人的習慣、場景的契合,以及對「好用」的重新定義。
愛範兒推出「AI 器物志」欄目,想和你一起觀察:AI 如何改變硬件設計,如何重塑人機交互,以及更重要的——AI 將以怎樣的形態進入我們的日常生活?
原本以為,三星 Galaxy S26 系列早已被曝光,發佈會也就走個流程。沒想到三星和 Google 還藏了一手。
兩家公司共同展示了 S26 搭載的全新 Gemini 智能體能力:口頭吩咐一句話,Gemini 就能在 Uber 幫你打車,或者 DoorDash 上點外賣。
圖源:Android Central
這個功能目前還處於早期預覽階段,僅在美國和韓國提供。
你可以理解為,Google 和三星一起聯手,做了一個全球版的「豆包手機」(準確來説叫豆包手機助手)。Galaxy S26 系列只是開始,這些能力后續會推送到 Google Pixel 10 手機,以及更多 Android 17 設備上。
在看過、用過許多個手機/電腦系統級 AI 智能體,也深度使用過「豆包手機」之后,再看這次的 Gemini 智能體,我覺得關於它的討論不該止於一個「新功能」。
誠然,這不是 Android 操作系統的底層框架首次爲了容納智能體而被深度定製——包括 OPPO、榮耀、華為等在內的許多廠商都已經做了相當多的早期的嘗試。
但這可是 Google,是 Android 操作系統的絕對擁有者。
如果説字節跳動作為一個「外人」,做的嘗試對國民級 app 犯了「大不敬」——Google 來做這件事情,意義就完全不一樣了。
不過別急,我們還是先看看,這次 Google 和三星做的「豆包手機」,到底怎麼一回事。
三星和 Google 這次展現的「Gemini 自動任務」能力,能夠模仿人類操作手機,從而實現任務的自動化。背后的實現思路,是 AI 讀屏理解 + 系統底層/應用層 API 的雙重路徑。
需要注意的是,字節和努比亞共同開發的「豆包手機」,重度使用系統級權限的能力,以及讀屏,而非 API。你可以理解為,豆包手機主要走的是「沒跟應用開發者打好招呼」的(至少主流國民級 app 沒有),「硬來」的實現思路,也為國民級 app 對其封殺抵制留下了把柄。
而三星和 Google 這次在 Galaxy S26 系列上做的 Gemini 智能體,可以説兩者兼備。根據三星方面透露的信息,其應用商城排名前 200 的應用都能支持(但僅限特定應用的使用效果可以保證,后面詳述)——説明三星、Google 至少大體上這些應用開發者打好了招呼。
我們來看《連線》雜誌的體驗效果:直接呼出 Gemini,告訴它自己要去機場,Gemini 應用本身會打開一個「虛擬窗口」中打開 Uber,並在后臺開始執行這個動作,用户可以隨時點擊進入查看 Gemini 的執行進程。
由於當地有幾個不同的機場,Gemini 很快又提醒用户選擇合適的目的地;下單時,Gemini 也會把界面推到用户面前,方便用户選擇合適的車輛並支付。
Gemini 的「虛擬窗口」,可以理解為一個沙箱化的「虛擬機」,是 Google 對用户隱私保護的一種考量。過去的 Gemini 運行在 Android 系統中,但這次的新 Gemini 智能體操作應用時,僅限在這個沙箱內工作,並不會觸及設備的其他部分。
再多提一嘴:如果大家用過 Manus、 月暗的 Kimi computer、智譜 AutoGLM 等,具備雲電腦/雲手機能力的智能體產品,應該就很容易理解這個 Gemini 虛擬機的邏輯了。
圖源:9To5Google
這算是相當簡單的任務,不少國產 AI 手機助手在一年前都已經攻克了這種場景。
而 Gemini 更加殺手級的能力,是和此前已經長線佈局的讀屏、抓信息特性相結合。
比如,當用户和朋友聊到聚會要訂披薩,用户可以直接叫出 Gemini,吩咐一句「弄清楚訂單」,Gemini 就能直接抓取聊天中提到的披薩店,甚至特定的披薩種類,整理好每個人的需求。
隨后,用户可以直接讓 Gemini 在外賣平臺 Grubhub 上點外賣,AI 會按照剛梳理完成的訂單需求,在后台自動化把所有食物添加到購物車,交付給用户確認和下單。
有時,訂餐的情況會沒那麼順利,Gemini 也會嘗試自己先去解決突發狀況,並給用户提供解決方案。有一次,披薩店在繁忙時段限制了大號披薩的下單量,Gemini 就會詢問能不能點兩個中號代替。
還有一個例子:用 Google Keep 筆記列舉了燒烤派對的出席名單,並標註了素食主義者。Gemini 可以先計算好整個派對總共需要多少熱狗和麪包,然后再讓它去採購食材,幾分鍾后商品全部被安放在了 DoorDash 平臺的購物車里。
Google Android 生態系統總裁 Sammer Samat 透露,Gemini 並非提前「記住」了這些平臺操作的步驟和線路,而是真的在利用推理能力,模仿人類查看屏幕並進行下一步操作,這意味着 Gemini 未來能在更多場景發揮潛力。
這里你能看到,Gemini 首批主打訂餐、叫車場景,這一點倒是更像春節前千問所做的事情。
圖源:Wired
又一個「豆包手機」,來自 Android 官方
對比真正「全能」,連微信收藏都能幫忙找的豆包手機助手(至少在被抵制之前),Gemini 目前的能力還相當侷限,聚焦在打車、外賣、雜貨這些日常場景,雖説底層技術能力更強,但用户的實機使用效果,跟鴻蒙的小藝、榮耀的 YOYO 等國產手機 AI 助手並無太大不同。
不過正如文章一開頭提到,Google 手握一整個 Android 生態,有着絕對的號召力和掌控力。
隨着 Gemini 自動化能力的發佈,Google 也詳細公開了背后 Android 系統的底層佈局和未來計劃——有兩個方向,簡單來説,就是既「蘋果」又「豆包」。
首先,Google 去年發佈了一個名叫「AppFunctions」的框架,允許開發者公開應用特定的功能和特性入口,以便 AI 助手調用。
Google 將 AppFunctions 類比為 Android 的「模型上下文協議」(MCP),可以簡單理解為一個對話標準,幫助第三方的 App 應用和 AI 模型進行對接。
這個框架類似蘋果的 App Intents。在蘋果的構思中,用户可以使喚 Siri 來操作各種 app 來實現功能,而底層實現方式就是通過 App Intents ——新一代 Siri 迟迟不能落地的前提下,App Intents 足以提供不錯的效果。
Google 的 AppFunctions 也是同理。
比如用户下達指令,希望能從好友的電子郵件中找到一個食譜,並將相關配料加入購物清單中。AI 接到命令,首先調用郵件 App「搜索」的功能入口,檢索並提取出相關內容,然后調用備忘錄的「購物清單」入口,把數據填入整理。
一些 AppFunction 功能已經在三星 Galaxy S26 和 One UI 8.5 系統中落地。比如,用户可以對 Gemini 下達指令,找出相冊中的特定照片,並用短信發送給朋友。
需要注意的是,整個過程中,Gemini 不需要打開相冊和短信 App,甚至沒離開 Gemini App,而是通過 AppFunctions,把對應入口抓取到 Gemini 之中執行操作,效率更高。
本質上,基於 AppFunctions 的實現方式,和過去的 API 路徑邏輯相同。這是一種「打好了招呼」的解題思路。
但是,並非所有 App 都做好了相關的適配。沒關係,Google 還做了另一手準備。
昨天發在 Android 開發者博客上的一篇文章中,Google 明確提出:公司還在開發一個 UI 自動化的框架,讓 AI 助手和第三方應用模仿人類,直接打開 App 一步步操作。
——這,就是翻版的「豆包手機」了。
不過,儘管 Google 説以后 UI 自動化會承擔真正的「重活」,在這次的 Galaxy 26 系列當中,UI 自動化只是一個「早期預覽版」。
豆包手機幫我種草比價洗發水
如果説 AppFunctions 需要 App 開發者進行額外的適配工作,那麼 UI 自動化框架則是把工作量都留給 AI 智能體,無需任何額外適配,但效果非常取決 AI 智能體的能力,優勢就在於一上線就能覆蓋大量應用。
現在你可以看到,在 Google 的 Android Gemini 智能體計劃中,AppFunctions 和 UI 自動化是兩條路線,互為補充:通過規範化、可追溯的接口方式來確保最大限度的兼容性,同時為真正代表未來的讀屏交互模式打好基礎。
Google 還表示,這不會只是 Gemini 的專屬功能,而是 Android 系統的特性。
這也意味着,未來不管是手機廠商自己內置的 AI 助手,還是 ChatGPT 等第三方應用,都能調用 AppFunctions 執行任務,或者「讀懂」手機 UI 進行自動操作。
值得一提的是,在國行用不了 Gemini 的情況下,三星 Galaxy S26 的 Bixby 助手也能實現點外賣、叫車、電商比價的功能。我們可以合理推斷,三星在國內也找到了一家模型供應商來替代 Gemini 的身份,至於這些大模型小龍當中具體是誰,可能就取決於過去一年里誰在手機智能體上成績更突出了。
去年「豆包手機」驚艷亮相,又因為令人遺憾的情況而「早夭」。在深感遺憾的同時,也讓我們不禁去思考,AI 自動化的模式,就是 AI 手機的理想模式嗎?
這個問題,沒有個三五年也得不出答案。至少,豆包手機不是單打獨鬥,手握 Android 系統的 Google,同樣選擇了這個路線,而且話語權大得多。
其實當豆包手機火到海外之后,就有網友開始暢想,如果 Google 在 Pixel 以及 Android 手機上推廣這個技術,那前景將會非常廣闊。
雖然我覺得,Google 對於怎麼回答「AI 手機」這個命題,其實也沒有一個非常清晰的答案,更像是因為手上同時有 AI、系統和硬件,每個方向都嘗試一下,説不定就有一條路跑通了。
但至少,Google 已經為 Android 打好了「系統級自動化」的樣板,接下來不少新機,都有了化身「豆包手機」的潛力。
這個浪潮或許還不止於 Android 陣營。別忘了,蘋果已經和 Google 達成合作,Gemini 將成為 Siri 的技術支持。而 App Intents 和 AppFunctions 又非常相似……
AI Siri 的演示
再往前看一點:Gemini 智能體甚至不只侷限於 AI 手機。在 Sammer Samat 設想中,未來智能眼鏡、AI 吊墜,甚至是汽車,只要有 Gemini,就能用它來完成複雜的任務——當然,這樣的場景距離落地還有距離。
不過,Google 也只是在技術層面跑通了 AI 自動化的路線,而範式成立,不代表問題消失。豆包手機當時遇到的種種矛盾,也會成為后來者不得不面對的挑戰。
首先當然是隱私和安全問題。Google 的餅畫得很大,未來調用、操作手機 App 的將不僅限於 Gemini,一些第三方 AI 應用能更深入用户的數據核心,如果有偽裝的惡意應用利用了這些接口,也會造成更大的損失。
圖源:9To5Google
更激烈的矛盾,是手機硬件廠商、模型/智能體能力提供商、大平臺應用這三者之間,圍繞 AI 時代新「入口」的爭奪。這也是原版的豆包手機,一度最難逾越的高牆。
畢竟,用 Gemini 叫車,可能意味着用户不用再看到 Uber 的會員促銷、廣告推薦,甚至不再形成品牌黏性,直接損害到應用服務商/廣告行業的收益。
中國有互聯網/AI 巨頭,海外何嘗不是如此?像 Meta、Amazon 這樣的老對手,本身還擁有強勢的平臺與生態,它們未必心甘情願對 Google 開放,讓 Gemini 來自動化一切。無論是以隱私、安全,還是平臺規則為由,設置限制、提高接入門檻,博弈必然發生,爭鬥將進一步白熱化。
至少 Google 對未來很有信心。Sammer Samat 認為,AI 技術已經進入了「正在進行時」,開發者與其絞盡腦汁對抗 ,還不如去思考一個合適的方式擁抱它。
新與舊的對抗不可避免,即便是用户量再大的國民級應用也不會永遠獨善其身。最終的勝利者,多半可能是那些在變革前夜,就已經在勇敢追逐的玩家。
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html
本文來自微信公眾號「愛範兒」(ID:ifanr),作者:蘇偉鴻 杜晨 ,36氪經授權發佈。