繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

在瀏覽器里感受到AI 的「人味」

2025-08-13 13:56

原標題:在瀏覽器里感受到AI 的「人味」

最近 AI 界的大新聞是 GPT-5 和谷歌的世界模型 Genie 3。然而,在無人在意的角落里,微軟悄悄把 Edge 進化成了了 AI 瀏覽器。

上一次聽到 Edge 的消息還是 IE 正式關停的時候,Edge 作為 IE 的繼任者難免會被拿出來討論,通常沒有什麼好話。

再上一次是 Edge 加入 sidebar 功能的時候,罕見地搶了一批 Chrome 的用户。

時至今日,Edge 的風評似乎沒有比曾經的 IE 好到哪里去。

都 2025 年了,居然還有瀏覽器的首頁充斥着閃爍的 MSN 資訊、天氣卡片、股市小窗口,以及永遠關不掉的「熱門故事」。與此同時,微軟不斷地在給 Edge 加入「無用的新功能」,讓系統變得越來越臃腫。

MSN,原來你沒死透|圖片來源:Edge 瀏覽器截圖 MSN,原來你沒死透|圖片來源:Edge 瀏覽器截圖

但如果你願意再給 Edge 一次機會的話,一鍵開啟 Copilot 模式,Edge 就變成了神似 Dia 的樣子:

乾淨得不像微軟出品

這個首頁就正常多了|圖片來源:Edge 瀏覽器截圖 這個首頁就正常多了|圖片來源:Edge 瀏覽器截圖

01

微軟,再造一遍瀏覽器

要讓 Edge 變成 AI 瀏覽器,除了要更新到最新版本之外,還需要掌握一些小小的「魔法」。然后在設置的「AI 創新」一欄,就可以開啟 Copilot 模式。

Copilot 模式的形態介於谷歌在 Chrome 有限 Gemini 集成,和 Manus 這樣完全的 AI 瀏覽器之間。

在 Copilot 模式下,首頁就變成了一個對話框,你可以直接用搜索引擎搜索、詢問 Copilot 或者讓它深度思考。這一點和其他主流的 AI 瀏覽器差別不大。

Copilot 的第二個入口在地址欄左側,一顆小藥丸形狀的圖標,單擊就可以呼出,或者讓它固定在右側。

Copilot 的第二個入口在地址欄左側|圖片來源:Edge 瀏覽器截圖 Copilot 的第二個入口在地址欄左側|圖片來源:Edge 瀏覽器截圖

官方説它可以「感知所有標籤頁」。於是我打開了一篇論文、一份財報,以及一個亞馬遜相機的搜索頁面。隨后我告訴 Copilot:「幫我總結特斯拉的財報,還有這篇論文的大綱,以及我想選購一款性價比高的相機。」

一分鍾后,Copilot 分別概括了財報和論文,附上了各個價位的最 佳相機,並暗示了我給出的需求並不精準

這一瞬間,我確實有一種錯覺,有另外一顆大腦正在替我工作。

Copilot 同時分析財報和論文,並給出選購建議|圖片來源:Edge 瀏覽器截圖 Copilot 同時分析財報和論文,並給出選購建議|圖片來源:Edge 瀏覽器截圖

這種總結能力也能遷移到視頻上。當你在 Edge 中打開 YouTube 視頻時,只要呼出 Copilot 並指示「總結視頻」,它就會給出總結。

美中不足的是,Copilot 的這種感知並非全自動的,需要你手動 @ 標籤欄,它才能替你工作

不過,最能讓我產生「幻覺」,是 Copilot Vision。這是一個交互方式上非常新鮮的功能,Copilot 可以直接看到你的屏幕,並以此為基礎和你用語音交互,就像你和朋友共享屏幕一樣。

Vision 讀取屏幕,並給出建議|圖片來源:Edge 瀏覽器截圖 Vision 讀取屏幕,並給出建議|圖片來源:Edge 瀏覽器截圖

例如在一個典型的購物場景,Copilot Vission 就可以直接看到屏幕上的備選產品,並給出選購建議。打開 Copilot Vission,一個帶着濃郁廣普口音的中年女聲就會很熱情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那種廣東阿姨。

不得不説,現在的 AI 語音已經做得非常自然,已經不太分辨得出 AI 味。碰到 AI 驗證的時候,它還會主動安慰你:

「是不是挺煩人的」。

這我還是第 一次在 AI 身上感受到了人味,語音交互帶來的情感濃度的確要比文字強很多

但是就功能性來説,Vission 還算不上實用。一方面是它的圖像識別速度跟不上我的瀏覽速度。另一方面,它在圖像和語音識別的準確率上也有待提升。例如它會把「IPX6」識別成「IPX4」,我用語音糾正了它,它馬上道歉,但是聽成了「IPX7」。

目前的 Vision 有一點像家里的女性長輩,不懂科技,聊天信息密度不高,但是非常包容,情緒價值拉滿

以上就是 Edge 最主要的功能了。還有一些功能微軟表示正在開發中,例如 Agent 能力、智能標籤分組或者是動態的 AI 助手。

實際上,很多功能微軟已經開發完畢、處於測試階段了,出於大公司的保守,它沒有集成到 Edge 中。但是沒有關係,進入單獨 Copilot 主頁,打開「實驗室」,你可以看到,微軟確實在開發一些好玩的東西。

Copilot 實驗室|圖片來源:Edge 瀏覽器截圖 Copilot 實驗室|圖片來源:Edge 瀏覽器截圖

Copilot 3D,可以一鍵將圖像轉換為 3D 模型。上傳自己的照片,你就可以輕松得到一個「逼真」的 3D 頭像。

Copilot 遊戲,體驗原汁原味的上古 FPS 大作《雷神之錘 2》,並且每一幀都是由 AI 實時生成的,同時畫面非常卡頓。

Copilot Actions 是微軟最接近「Agent」野心的功能。我試着讓它預訂了一張 8 月 10 號從上海飛北京的機票。Copilot 大概跑了 20 分鍾,完成了點點鼠標一分鍾就能做完的工作。

但奇妙之處在於:它允許我隨時「搶方向盤」

當它差點給我選了箇中轉航班時,我可以隨時接管瀏覽器權限,把航線拉回直飛。這種「人機共駕」的體驗,比那些一路黑箱跑到底的競品要安心得多。

實際上,這樣操作之后,跑任務的效率會大大提升,最終的出品也可控得多。我覺得這纔是目前 Agent 最實用、最可靠的人機協作形態。正如它的名字 Copilot 一樣,這是一種副駕駛員的哲學。

用户可以隨時暫停,接管瀏覽器 | 圖片來源:Edge 瀏覽器截圖 用户可以隨時暫停,接管瀏覽器 | 圖片來源:Edge 瀏覽器截圖

02

微軟的歷史包袱

總的來説,Edge 瀏覽器的 AI 進化給到了不錯的體驗,基礎功能不遜色於主流工具的同時,也有一些自身的亮點,例如標籤感知和 Vision。

但與此同時,這還不是一款可以成熟到覆蓋所有 Edge 用户的產品。很多宣傳的功能並沒有完全兑現,各個功能的入口也分散在四處。最明顯的就是,地址欄旁 Copilot 入口支持附件上傳和語音交互,而主入口的 Copilot 反而不支持這些功能。

更大的割裂感在於 Edge 瀏覽器本身和 Copilot 模式上。

單就視覺而言,傳統功能區延續了 Win11 的 Fluent 圓角玻璃;AI 面板則是現代極簡的風格,彷彿兩代人共用一張辦公桌。

兩種設計風格同時共存在一個頁面

更重要的功能性上,Edge 團隊揹負着沉重的歷史包袱:兼容模式、IE 模式、企業策略、臃腫的 PDF 閲讀器……而 Copilot 團隊顯然想再造一個「AI 優先」的物種。兩股力量在同一具身體里拉扯,導致入口分散、菜單嵌套、選項重名。

於是,Edge 就像是一座仍在施工的跨河大橋:橋這頭,是微軟多年堆出來的舊公路,坑窪卻熟悉;橋那頭,是閃着霓虹的 AI 新大陸,誘人卻斷續。

用户站在橋中間,有一些迷茫。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。