繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

AI能顛覆搜索引擎嗎?

2024-03-18 18:30

2022年 11月的最后一天,OpenAI在沒有任何事先宣傳的情況下發布了其劃時代的生成式AI產品ChatGPT。憑藉其出色的人機交互表現和任務處理能力,ChatGPT創造了軟件用户增速的奇蹟。短短5天,其用户量就突破了100萬;不到兩個月,其用户量就突破了1億。

當越來越多人為OpenAI的這款產品着迷的時候,一個問題出現了:雖然這款AI產品的能力強大,但從實用的角度看,它最大的價值究竟在哪里呢?一個得到較高認可的答案是,它可能會成為新一代的搜索引擎,從而徹底動搖谷歌在搜索市場上的壟斷地位。

應該説,這個答案是頗有道理的。在ChatGPT橫空出世之前,谷歌一直被認為是全世界AI實力最強的企業。在過去的幾年中,它一直在從事大語言模型的開發,並且積極嘗試將這項技術與其現有的搜索引擎結合。事實上,就連ChatGPT開發過程中所用到的關鍵技術Transformer,也是由谷歌發明的。在這種情況下,OpenAI率先發布了自己的大語言模型,就不得不讓人聯想到是爲了挑戰谷歌的地位。后來的事實似乎也印證了這一點。2023年2月,OpenAI的長期盟友和幕后支持者微軟率先宣佈將GPT模型集成到自己旗下的必應搜索引擎當中。這一舉動讓很多人驚呼:谷歌在搜索市場上的地位可能要危險了!

情況果真如此嗎?在一年多前的一篇專欄里,我曾判斷説至少在短期內,發生這種情況的概率很小,目前的發展狀況大致上印證了我的判斷。根據網絡諮詢機構Statcounter的統計,2023年2月,谷歌在全球搜索引擎市場上的份額為93.37%。在此后一年中,雖然其市場份額有所下降,但到2024年2月,其市場份額仍高達91.61%。反觀必應,雖然在搭載了GPT模型之后,其市場份額有所上升,但上升的效果並不明顯。2023年2月,其市場份額為2.81%,到2024年2月,其市場份額為3.32%。由此可見,雖然必應借生成式AI之勢,在一定程度上提升了自己的競爭力,但這種提升的力量是有限的,離動搖谷歌統治地位的程度還差很遠。

那麼,谷歌為何可以在生成式AI大潮的衝擊下巋然不動?它成為長盛不衰的搜索巨頭背后的祕密何在?在搜索領域,又有哪些力量在挑戰着谷歌?搜索市場的未來又會是什麼樣?要回答這些問題,我們還得從頭説起。

最初的信息入口

1994年,一位來自中國臺灣的年輕人楊致遠(Jerry Yang)從斯坦福大學機電係獲得了碩士學位,接着,他申請了本校的軟件工程學博士項目。在準備研究課題期間,他經常泡在網上。當時,互聯網的發展還處於初級階段,每天都有很多網站誕生,網絡的信息正在不斷地膨脹。然而,要找到一個網站並不容易。普通用户很難知道哪個網站有自己需要的信息,即使知道了,要記住那些宂長而雜亂的網址也讓人頗為煩惱。面對這種情況,曾經在校圖書館兼職的楊致遠意識到,為互聯網做一個類似的檢索目錄或許是一樁不錯的主意。他將這個主意告訴了自己的同學大衞·費羅(David Filo)。兩人一拍即合,一起手動收集了一大批實用且優質的網站,並將它們分門別類,做成了一個導航網站。他們用兩人名字的合稱,將這個網頁命名為「傑瑞和大衞的萬維網指南」,並將其放上了網。

一開始,楊致遠和費羅製作導航網站的目的僅僅是爲了方便自己和朋友們檢索信息。但這個網站一上線,就備受歡迎。一開始是他們身邊的朋友,后來是朋友的朋友……很快,數以萬計的人涌向了這個此時還略顯簡陋的網站,並將它作為自己探索互聯網的起點。楊致遠認識到,致富的機會來了。於是,他乾脆放棄了攻讀博士的打算,專心和費羅一起搞起了這個網站。爲了讓自己的網站更容易被人記住,他們將它的名字改成了《格列佛遊記》中一個野蠻族羣的名字——雅虎(Yahoo)。有意思的是,在他們試圖註冊Yahoo商標時,發現一家烤肉店已經搶注了這個名字。為表區別,楊致遠就在單詞后面加了一個歎號。於是,后來大家熟悉的「Yahoo!」就誕生了。

由於成功地抓住了互聯網發展初期的紅利,雅虎很快成爲了當時訪問量最高的網站。關於雅虎和它的這兩位創始人的故事,已經有無數文章進行了介紹,在此就不再展開了。

這里想指出的是,楊致遠和費羅之所以能取得如此巨大的成就,其關鍵是因為他們做到了網絡搜索的三件要事中的一樣——為信息提供了一個類似圖書館的檢索目錄。雖然用今天的眼光看,誕生之初的網站十分簡陋,但對於當時的用户而言,那已經勉強夠用了。然而,隨着互聯網的快速發展,這種依靠手工整理的指南網站就逐漸難以滿足人們的需要了。人們還希望可以找到一些小眾的網站和新網站的信息,而顯然,如果僅僅依靠人力,這些網站是很難被及時添加到目錄中的。在這種情況下,一種可以自動爬取網站信息的技術就變得十分重要了。

幸運的是,早在雅虎網站上線之前,這種自動爬取網站信息的技術就已經存在了,這就是我們現在熟知的網絡爬蟲(Spiders)。它的原理是通過一個腳本文件自動在網上查找相關的資源,然后訪問並保存它們。

1990年時,當時還在麥吉爾大學攻讀研究生的艾倫·埃塔奇(Alan Em-tage)兼職擔任了該校信息技術系的一名系統管理員。出於工作需要,他需要為學生和教職員工在各種公共的FTP(FileTransferProtocol,即文件傳輸協議的簡稱)上搜尋各種軟件。在當時,這實在不是一件輕松的事情。爲了減少自己的工作量,他寫出了世界上第一個爬蟲程序Archie。Archie可以自動瀏覽網上的公共FTP,下載相關的文件列表,並將它們保存在一個數據庫中。這樣,人們需要什麼文件,就可以直接搜索數據庫,它就會返回這些文件對應的網址。

埃塔奇的工作為在浩瀚的網絡上查找所需的資源提供了一個思路。受其啓發,不少人用爬蟲建立了專門的網絡資源索引。比如,比爾·希蘭(Bil Heelan)在1991年創建了Veronica,用以幫助用户在Gopher服務器上定位文件;而史蒂文·福斯特(Steven Foster)則在1991年發佈了Jughead,幫助用户檢索網絡上的文件和元數據。楊致遠在創辦了雅虎之后,也很快注意到了爬蟲技術,並用它來蒐集需要的網站。這樣,原本由純人工蒐集信息的雅虎就進化爲了自動更新的指南網站。

相比於純人工,爬蟲技術無疑是大幅提升了信息採集的效率。得益於這種技術,以雅虎為代表的信息門户網站可以十分及時地獲取和更新網站信息。可以説,雅虎在那段時間能取得巨大成功,這項技術功不可沒。

不過,隨着互聯網信息的膨脹,類似的網站又開始面臨一個問題:當信息越來越多時,人們怎麼才能從大量的信息當中,以最低的成本找出自己想要的信息。雖然從理論上講,按照信息門户網站提供的檢索目錄一一嘗試,人們總可以找到自己想要的網站,但那樣的效率實在是太低了。在這種情況下,人們對更有效率的信息檢索工具的需求就變得越來越迫切了。

搜索引擎時代的到來

1996年,斯坦福大學的兩名博士生謝爾蓋·布林(Sergey Brin)和拉里·佩奇(Larry Page)在該大學的服務器上推出了一個原型網絡搜索引擎谷歌(Google)。和過去的信息檢索工具相比,谷歌不僅可以更迅速地從網絡上爬取各種最新的信息,更為重要的是,它還可以在紛繁的信息中,準確地將那些最重要的信息呈現到用户面前。

谷歌為什麼可以做到這一切呢?很顯然,更快的爬取速度依賴於更高效率的爬蟲。至於信息的精準呈現,則來自於所謂的「佩奇排序算法」(PageRank Algorithm)——由於Page既可以用來指其發明人佩奇,也可以用來指網頁,因而這個算法名可謂一語雙關。「佩奇排序」是一種怎樣的算法呢?直觀來説,它的靈感來自於學術圈的論文影響力排名。我們知道,在學術界,論文是科研人員最重要的產出。在各種考評當中,論文都是關鍵的參考指標,除了看論文的數量,更要看論文的質量。那麼,什麼樣的論文才算是一篇高質量的論文呢?最初,人們將引用率作為質量的指標,一篇論文被引用的越多,它的質量就被認為更高。但是,這很快又引發了一個問題:一些學者爲了提升自己論文的引用率,就瘋狂地發文章,然后在自己新的文章中引用自己過去的文章。

另一些學者則採用相互合作的方式,一起「刷」引用率。這就讓引用率這個指標失去了意義。針對這個情況,有人想出了對引用率進行加權的思路,即只有被重要的文章引用,這次引用纔可以獲得高的權重,而如果只是被不重要的「水」文引用,權重就很低。用論文的加權被引用率,就可以對其重要性進行更準確的刻畫。當然,細心的讀者應該已經發現這里有個悖論:只有當論文被更多重要論文引用時,它纔可能是重要的,但怎麼判定引用它的論文是重要的呢?這似乎就陷入了一個「雞生蛋、蛋生雞」的困境。好在從數學上看,這一點並不難處理,人們只需要用一種被稱為「不動點」(fixedpoint)的工具就可以來處理這個問題。這樣,人們就得到了一種評價論文重要性的辦法。

佩奇排序就採用了這樣的思路來處理網頁。在不同的網頁之間,經常會用超鏈接進行相互的鏈接。從性質上看,一個網頁被其他的網頁鏈接和一篇論文被其他論文引用是非常類似的。類似的,如果一個網頁更多地被重要的網頁鏈接,那就説明這個網頁的重要性更高。這樣,人們就可以採用類似對論文影響力排名的辦法,來對網頁的重要性進行排名。

在用上述思路對網頁進行處理之后,人們只需要輸入相關的關鍵詞,谷歌引擎就可以找出具有這些關鍵詞的網頁,並將它們按照重要性生成排序,再呈現給用户,用户就可以比較容易地找到自己想要的網站和信息。

在開發出谷歌引擎之后,布林和佩奇十分興奮。起初,他們只是想把這個家伙賣個好價錢,然后回到學術界謀個教職。1998年,他們找到雅虎,要價100萬美元出售谷歌引擎和它的核心技術——佩奇排序算法。儘管楊致遠親自接見了這兩位學弟,並和他們相談甚歡,但正處於事業巔峰的他並沒有看得上這個「奇技淫巧」。因而,雅虎非常遺憾地錯過了這次收購谷歌的機會。

既然沒法把谷歌賣出去,那麼就只好自己留着經營了。正所謂時勢造英雄,隨着互聯網大潮的澎湃洶涌,谷歌這個工具的價值日益凸顯,其商業價值自然也水漲船高。等到2002年,楊致遠后知后覺地認識到谷歌的潛力,並試圖收購它時,他的兩位學弟向他報出的價格已從當初的100萬美元上升到了50億美元。雖然此時的雅虎估值很高,但事實上,其年營收只有10億美元上下,並沒有能力承擔這個收購價,於是只好放棄了這個念頭。此后,谷歌一路高歌猛進,而雅虎則日趨沒落,最終在2016年賣給了美國電信運營商Verizon。

覆盤從雅虎誕生到谷歌強勢崛起、取代雅虎地位的這段歷史,我們可以總結出在為用户提供信息導航服務過程中需要的三件事:第一件是要保證自己佔有信息的充分性。這一點,埃塔奇發明的爬蟲實現了;第二件是要對信息進行有效的整理。雅虎之所以能有當初的輝煌,就是靠了這點;第三件則是需要從海量的信息中幫助用户挑出最重要的信息。谷歌正是在這一點上實現了破局,才取得了它后來的地位。

從搜索引擎到賺錢機器

值得一提的是,作為后來者,谷歌之所以可以迅速超越其前輩雅虎,除了因為它在信息的檢索效率上要遠高於雅虎這樣的分類門户網站,更是因為它找到了一條成功的變現思路。

儘管我們並不能確切知道當初面臨主動找上門求收購的布林和佩奇,楊致遠為什麼拒絕了他們,但據我猜測,營利模式的不明確應該是一個重要的原因。對於當時的門户網站而言,怎麼賺錢是相對清楚的:網站的運營者只需要將網頁的空白處作為廣告位進行招租,就可以得到廣告收入。事實上,即使到現在,這依然是很多門户網站最重要的營利方式之一。然而,對於谷歌這樣的搜索引擎,要做到這一點似乎是比較困難的。固然,谷歌也可以在網頁的邊角處闢出一些廣告位,但這一方面會嚴重影響用户體驗,另一方面由於搜索引擎缺乏像門户網站這樣的層次性,隨意塞廣告的地方也非常有限。

谷歌是如何破局,將搜索引擎轉變成了賺錢的工具的呢?答案依然是廣告。承擔為谷歌開闢廣告業務重任的是薩拉爾·卡曼加(SalarKamangar),谷歌的第九名員工。開始,他的想法是將網頁邊角的一些空間拿出來進行廣告招商。這雖然確實帶來了一定的廣告收入,但數量並不大。一次偶然的機會,卡曼加突然想到,或許將搜索結果的網頁中的一部分拿出來作為廣告位是一個更好的主意。當人們搜索某個關鍵詞時,他們肯定是對與這個關鍵詞相關的信息感興趣。如果在搜索結果中放入針對性的廣告,其轉化效果可能會好很多。比如,當用户搜索「手機」時,他很可能是想買手機。這時,如果在搜索結果的邊上插入某個品牌手機的廣告,用户就很可能優先考慮這個品牌的手機。在這種思路的指導之下,谷歌的關鍵詞廣告誕生了。

那麼,如何對搜索結果頁面的位置進行配置呢?卡曼加的思路是進行拍賣。最初,他們所設計的拍賣形式是「廣義最高價拍賣」(GeneralizedFirstPriceAuction)。后來,谷歌根據經濟學家哈爾·範里安(HalVarian)的建議,將拍賣形式改成了「廣義次高價拍賣」(GeneralizedSecondPriceAuction)。

所謂廣義最高價拍賣,通俗地講,就是當有多個廣告主競拍多個廣告位時,將最好的廣告位分配給報價最高者,第二好的廣告位分配給出報次高者……以此類推。而在廣義次高價拍賣中,廣告位的分配和廣義最高價拍賣一樣,但報價最高者按照次高報價出價,報價次高者按照第三高的報價出價……以此類推。

舉例來説,假設有甲乙兩個廣告位拍賣,甲位置比乙位置更好。有A、B、C三個廣告主來競拍,他們對廣告位的報價分別是12美元、10美元和8美元。那麼在廣義最高價拍賣下,A將拍得甲廣告位,並支付12美元;B將拍得乙廣告位,並支付10美元。而在廣義次高價拍賣下,廣告位的分配方式依然不變,但甲乙兩人需要支付的價格卻分別變成了10美元和8美元。

根據拍賣理論,在廣義最高價拍賣中,競價者可能隱藏自己的真實意願支付價。設想,如果他對一個拍品的心理價位是10元,他的報價絕不會超過10元。因為如果高於心理價位,他即使贏得了拍品,也會感到虧了。現實中,他的最優策略一定是報價低於10元。至於低多少,要綜合各方面信息,考慮各種報價下贏得拍賣的概率而定。由於在線拍賣中,拍賣是反覆進行的,所以競拍者通常會根據前一輪的拍賣情況對報價進行大幅的調整。這就會導致同一個廣告位的價格經常會有大幅度的起伏。相比之下,廣義次高價拍賣則可以引導競拍者總是按照自己的支付意願出價。這樣,拍賣結果總是相對穩定的,同一廣告位的價格波動不會太大。

由於可供搜索的關鍵詞難以計數,因而谷歌可以拍賣廣告的位置也就遠遠高於雅虎這樣的分類門户網站。在關鍵詞廣告取得成功之后,谷歌又進一步開發出了很多廣告形式。目前,廣告業務已成爲了谷歌財務收入的支柱。在剛剛過去的2023年,谷歌的廣告收入約為2378.6億美元,佔到了其總營收的77.4%。

搜索引擎的護城河是什麼

在一個競爭的市場上,如果一家企業獲得了超額的高利潤,那麼它的業務一定會引來對手的垂涎。在谷歌取得成功之后,有大批的競爭者試圖蠶食其市場地位。比如,2009年,微軟就高調地推出了自己的搜索引擎必應,但即使如微軟這樣的財雄勢大,至今也僅僅從谷歌手中搶到了區區幾個百分點的份額。至於其他的同類挑戰者,除了像百度、Yandex等因地緣因素佔據了一些地區的市場外,幾乎都早已消失在了歷史的長河中。

那麼,究竟是什麼力量讓谷歌在搜索市場上保持了長盛不衰?或者説,谷歌究竟擁有哪些護城河呢?

比較常被提及的兩個因素是規模效應和網絡效應。

先看規模效應。要完成高質量的信息檢索,就必須儘可能完整地蒐集網絡上所有的相關信息,並且高效地將這些信息進行排列。這一切的實現,都需要投入巨大的固定成本。尤其是在移動互聯時代到來后,越來越多的信息被封閉在一個個的應用中,要將信息從這些封閉的應用中挖掘出來,難度可想而知。相比於這些前期投入的成本,后續搜索產生的邊際成本則是可以忽略不計的。在這種情況下,后來的競爭者在和谷歌這樣的在位企業的競爭中就會有先天的劣勢。

再看網絡效應。從經濟性質上看,谷歌這樣的搜索引擎是一個雙邊平臺。一方面,它用免費的搜索服務來獲取用户;另一方面,它用獲取到的用户來吸引廣告商。搜索用户越多,不僅可以讓它有更好的口碑,從而對新的搜索用户更有吸引力,還可以讓它更受廣告商的歡迎。當它有了更多的廣告商,獲得了更多的利潤后,它又有更多的資源改進服務,從而吸引更多的搜索用户。這樣的一種良性循環,就會讓谷歌在競爭中佔據更有利的位置。

誠然,以上這兩個因素確實是谷歌的重要護城河。但除了它們之外,谷歌其實還有一個常被人忽略的壁壘。在實踐中,爲了保證可以及時充分地獲取某一個網站的信息,搜索引擎就需要對這個網站部署網絡爬蟲。由於爬蟲程序通常會損害網絡的運行效率,因而網站的運營者會採用反爬手段,禁止爬蟲的部署,這就會使大部分搜索引擎很難抓到想要的信息。不過,對像谷歌這樣的頭部搜索引擎,網站的運營者們多會網開一面,因為對於大部分人來説,自己的網站能被谷歌檢索到其實是一種榮幸。這樣一來,谷歌就事實上被賦予了一種獲取信息的特權,而這對於一個優質的搜索引擎來説,是至關重要的。如果説對於像規模經濟、網絡效應這樣的護城河,競爭對手只要有充足的資金還有機會突破,那麼這種事實上的特權優勢就幾乎沒有破解的可能。在我看來,這纔是讓谷歌至今還能在通用搜索市場上保持「獨孤求敗」地位的主要原因。

邊緣地帶的革命

既然谷歌已經憑藉其獨特的先發優勢,穩穩地佔據了市場上的有利地位,那麼想做搜索的競爭者是不是就徹底沒戲了呢?這倒也未必。事實上,至少有兩種思路可以讓競爭者們能夠在搜索市場上分到一杯羹:一種是佔據某一利基市場;另一種則是顛覆這個市場。

先看佔據利基市場這個思路。具體來説,這條思路又有兩種實現路徑:

一種路徑是專注於某一個垂直的市場,做這個垂直市場上的搜索服務。我們看到,谷歌雖然在通用搜索市場上具有不可戰勝的地位,但在具體的垂直市場上,它的優勢並不明顯。比如,專業的數據公司可能在汽車市場上深耕多年,並積累了大量的數據,那麼它就可以在汽車這個局部的市場上做出更好的搜索引擎。事實上,現在的市場上,已經有了不少著名的垂直類搜索引擎,如Mocavo,Nuroa,Trulia和Yelp等,表現都非常不錯。

不過,垂直類的搜索引擎還存在着一個很大的弱項,即它本身還對谷歌這樣的通用搜索引擎有很大的依賴。現實中,當人們要獲取某個垂直行業的信息時,可能並不知道這個行業都有哪些專用的搜索引擎。爲了找到它們,他們可能還需要用谷歌等通用搜索引擎來檢索。在這種情況下,谷歌就事實上是決定了哪些垂直搜索引擎可以被看見的「守門人」。在某些條件下,如果它發現哪個垂直領域的搜索業務很有賺頭,它甚至可以直接下場做一個該市場的垂直搜索引擎,然后操縱通用搜索結果,將用户轉向自己。實際上,谷歌在現實中已經這麼做了。比如在歐盟的「谷歌購物比價案」中,谷歌就運用自己在通用搜索引擎市場上的優勢,將用户導向自己的比價引擎。儘管這個行為最終被歐盟認定為非法,谷歌也因此遭到了天價的處罰,但這個案例本身還是說明了垂直類搜索其實是一個可能處於風險中的買賣。

另一條路徑是平臺內或應用內搜索。在現實中,很多平臺或應用本身就培養了巨大的生態,這時,其生態內的內容就足以支持一個成功的搜索引擎。

以我們熟悉的微信為例:在微信內部,其公眾號和視頻號積累了巨大的內容資源。儘管從內容的全面性和豐富性上看,這些內部資源還很難和全網的資源相比,但從質量上看,它們卻比后者更好。因此,現在越來越多的用户在想查找某些信息時,會考慮微信的內部搜索,而非通用搜索引擎。類似的例子,國內還有小紅書、抖音等,它們的內部搜索在很大程度上已經成爲了人們制定旅遊攻略時的首選搜索引擎。

在國外,亞馬遜的內部搜索則是一個非常好的平臺內搜索案例。作為全球最大的電商平臺,亞馬遜內部的商品量和入駐的第三方賣家數都十分龐大,用户要檢索商品就必須依賴搜索。賣家們爲了能讓自己的商品獲得一個更顯著的展示位置,大多會願意向亞馬遜支付一定的費用。在這種情況下,亞馬遜就可以像谷歌一樣,對搜索的關鍵詞進行拍賣。由於和在谷歌上的搜索相比,這種內部搜索的最終轉化率通常要高上很多倍,因此亞馬遜內部搜索的關鍵詞也就可以比谷歌的關鍵詞拍出更高的價格。根據亞馬遜的財報,目前亞馬遜的年廣告收入已經接近400億美元,而其中的大部分就來自於關鍵詞廣告的拍賣所得。

這里尤其值得一提的是,相比於那些垂直搜索引擎,應用內和平臺內搜索可以説是更為安全的生意。畢竟,它們可以用技術的手段屏蔽通用搜索引擎的爬蟲,然后整個內部生態就成了它們自己的地盤。

不同的變革方向

相比於佔據某一個利基市場,用某些顛覆性的技術來挑戰既有的市場霸主無疑是更讓人激動的。自搜索引擎技術成為人們上網衝浪的主要入口之后,人們就沒有停止過對新的搜索思路的探索,並且已經在很多不同的方向上取得了進展。

第一個方向是增加對用户個性化的考慮。該方向的思路是比較直觀的:不同的用户搜尋同一個關鍵詞,他們想要得到的信息可能是不一樣的。比如,一個家庭主婦搜索「蘋果」,她可能是想找哪兒有更便宜的蘋果賣,而一個科技發燒友搜索「蘋果」,他想要了解的則可能是新型蘋果手機的信息。因而,根據不同用户提供不同的搜索結果,就被視爲了人們變革搜索技術的一個重要方向。

在這個方向上,已經有了很多實踐。比如,基於地理位置的搜索,就是推進搜索個性化的一類嘗試。很顯然,身處不同地區的人在搜尋某些信息時希望尋找的信息是不同的。比如當我們搜尋「外賣」時,最可能希望查找的是附近有哪些可供選擇的外賣。要滿足用户的類似需要,就要結合其所處的地理信息對搜索的結果進行重新篩選。目前,這種基於地理位置的搜索已經得到了很多的應用,如美團、餓了麼等外賣應用當中,就都搭載了這種搜索技術。又如,基於用户搜索的上下文進行的語義搜索是推進搜索個性化的另一類嘗試。其實這個思路很早時就在搜索領域得到了應用,例如一個名叫AskJeeves的搜索引擎可以讓用户選擇允許網站記錄自己的使用偏好,然后網站就會根據這些信息,向用户輸出他們最可能想找的信息。

如果沿着個性化思路走到極致,搜索就演化成了定向推薦。關於定向推薦的力量,我們已經在很多短視頻軟件那里充分體會到了。可以看到,如果從滿足用户需求的角度看,定向推薦無疑已經取得了極致的成功。不過,不少觀點都認為,它可能讓用户陷入信息繭房。因此,從幫助用户獲取信息的角度看,這是否可以算作成功,其實是頗值得商榷的。

第二個方向是應用知識圖譜、語義網等技術為用户提供更為集中的信息。最初,當用户在搜索引擎中輸入關鍵詞后,搜索引擎只會返回對應的網頁。在這種情況下,人們還需要從這些網頁中自行總結出自己需要的信息。很多時候,這其實是非常浪費時間的。針對這一點,一些搜索引擎就應用知識圖譜等技術,針對用户輸入的關鍵詞,將搜索到的信息先進行一定的綜合,然后再呈現給用户。比如,如果我們在谷歌、必應等搜索引擎中搜索「馬斯克」,那麼引擎除了輸出相關的網頁之外,還會給出一個由其生成的馬斯克簡介。如果用户僅僅想了解一下馬斯克的基本信息,那隻要看這個簡介就已經足夠了。

第三個方向是對可搜索內容的擴展。過去,搜索引擎只能支持文字的輸入,但有時候,這其實是不夠的。比如,人們在野外看到一朵花,希望知道它的名字,那麼之前的搜索引擎就不能給他們提供任何幫助。而隨着計算機視覺技術的發展,直接對圖形進行搜索也已經成爲了可能。現在,如果我們再遇到不認識的花,只要用手機拍下它的照片,並將其上傳到搜索引擎,就可以獲得關於它的各種信息。

第四個方向是對交互方式的改進。傳統上,用户執行搜索任務只能在搜索框中輸入關鍵詞,然后坐等搜索結果的返回。從用户體驗看,這種人機交互的模式並不算好。針對這一問題,探索與搜索引擎之間的新交互方式一直是人們努力的一個重要方向。目前,人們已經找到了不少與搜索引擎交互的新方式。比如,用語音向搜索引擎輸入關鍵詞。另外,由Perplexity公司在2022年推出的Perplexity.AI則首創了對話式搜索。用户可以通過和搜索引擎的不斷交互來不斷明確自己的需求,從而讓輸出結果變得更有針對性。

儘管人們已經在很多不同的方向上對傳統的搜索引擎進行了改進,這些創新也讓一些搜索新秀們成功地佔有了一些局部市場,但目前還沒有哪個搜索引擎在通用搜索市場上對谷歌這個傳統搜索巨頭構成全面的威脅。

造成這一現象的原因是多方面的。一方面,雖然各種改進都可以為新的競爭者進入帶來一些機會,但從搜索的本質看,一個搜索引擎成功的必要前提還是要能夠掌握廣泛、及時的信息。然而,從前面的討論可以看到,在谷歌佔據了先發優勢的條件下,這個前提是很難滿足的。另一方面,在很多的改進方向上,谷歌本身就是創新的引導者。例如,在基於地圖的搜索、基於知識圖譜的搜索,以及語義搜索等方面,谷歌都是作為引領者的形象出現的。從這個意義上看,雖然我們看到的只是谷歌一直站在原處,但其原因卻是因為它一直在奔跑。

AI能動搖谷歌嗎

那麼,隨着生成式AI技術的普及,谷歌在搜索市場上的地位會被動搖嗎?在我看來,至少在短期,谷歌的地位可能還很難被動搖。

事實上,如果我們拆解一下必應、Perplexity.AI等調用了AI能力的搜索引擎,就會發現它們本質上是將過去十幾年中搜索引擎的各種發展方向進行了整合,但並沒有在一些搜索的基本功能上進行改進。以必應為例,雖然在搭載了GPT模型之后,它可以用對話的方式更好地和用户交互,但由於它在數據爬取、數據整理等方面比起谷歌依然存在着劣勢,所以呈現出的結果依然很難得到用户的認可。很多用户發現,在採用必應進行搜索時,其輸出的內容在時效性和關聯性上都要遠遜於谷歌。由於在這些基本能力上處於劣勢,所以它很難通過交互模式等方面的改進來實現對谷歌的彎道超車。

另外需要注意的是,將AI引進搜索之后,還有非常大的風險。受技術條件的限制,目前的大語言模型還很難避免「幻覺」問題,AI經常會在和用户的對話中編造一些虛假的內容。如果僅僅是將這些內容應用於聊天或者娛樂,那固然無傷大雅,但一般來説,人們調用搜索引擎的首要目的是要尋找可靠的信息。在這種情況下,幻覺的影響可能就是致命的。雖然必應爲了防止幻覺的干擾做了很多努力,比如要求在輸出答案時標明出處,但測試表明,這並不能根除幻覺現象的干擾。

基於以上分析,可以得出結論:雖然生成式AI的價值十分巨大,並且它也確實會為搜索領域帶來很多有意思的新東西,但至少在短期,它應該還遠沒有達到徹底改變這個市場的規則、動搖以谷歌為代表的傳統巨頭的程度。更有可能的情況是,類似ChatGPT這樣可以與人交互的AI會和谷歌這樣傳統的搜索引擎長期並存,就像當年的谷歌和雅虎並存一樣。至於在長期,AI能否全面取代搜索引擎,這恐怕還需要更長的時間來檢驗。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。