繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

ChatGPT也漲不動了

2023-06-25 08:59

  深燃(shenrancaijing)原創

  作者 | 李秋涵

  編輯 | 魏佳

  你還在用ChatGPT嗎?

  在全球掀起AI熱潮的ChatGPT,似乎進入了瓶頸期。

  首先是關於ChatGPT的使用率,有不利的數據出現。6月初,摩根士丹利發佈的一項調查顯示,只有19%的受訪者表示他們之前使用過ChatGPT,只有4%的人表示依賴ChatGPT。調查表示,比例低的驚人。

  這項調查在今年4月進行,涉及人數為2000人。不過,在全球78億人口面前,這樣的樣本量不算大,也一定程度上降低了其參考性。

  還有一個基數更廣泛的數據值得關注,ChatGPT的增長已經明顯放緩。

  根據網站數據分析工具SimilarWeb數據,前期ChatGPT的訪問量增長率驚人,1月份的環比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環比增長率為12.6%,到了5月,這個數字已經變爲了2.8%。

  隨着ChatGPT普及,參考基數變大,增長率放緩是正常現象,不過,根據目前已有的趨勢來看,6月的環比增長率也有可能為負數。

  今年年初,ChatGPT像一聲驚雷,讓全球見識到了生成式AI的威力,也讓背后的GPT(生成式預訓練Transfomer模型)大火,掀起大模型創業潮。它刷新了很多數字,最讓人印象深刻的,是史上用户增長速度最快的消費級應用,在推出僅兩個月后,ChatGPT的月活用户已經突破了1億。

  但對它未來的發展,即便是創造者也很難給出明確答案。此前OpenAI董事會成員海倫·托勒就曾表示,「甚至創造它們的人也不知道它們能做什麼,不能做什麼。我預計,我們真正瞭解GPT-4能做和不能做的所有事情,可能還需要幾年時間。」

  ChatGPT現在的天花板,不代表就是GPT的天花板,但作為目前最厲害的大語言模型支撐的產品,ChatGPT的走向,也能成為觀察GPT應用的一個窗口。關於AI的狂想還在繼續,時間已經過去了近半年,我們好奇的是,ChatGPT的使用情況到底如何?它被高估了嗎?

  ChatGPT真的很多人用嗎?

  對於ChatGPT的使用體驗,不同行業、不同人答案不同。有人把它當玩具,使用了一兩次后就不再登錄;有人努力把它變為工具,在工作中以提高效率;也有人,在努力將ChatGPT變為工具的過程中失敗了,因為覺得它「不夠好用」。

  夏楠屬於第三種。她從事外貿行業,會用ChatGPT寫工作郵件,也會讓它解答一些生活中的煩惱,爲了能更好的使用ChatGPT,她都是用英文發指令。

  從2月開始使用ChatGPT,她的體驗分爲了三個階段,最開始是好奇,很多問題都想拋給ChatGPT,看它怎麼回答,探索它。從5月開始,她感覺ChatGPT「變笨了」,之前能做到的,現在做不到了。現在,她對ChatGPT的評價是,「不好用」。

  比如最近,他們公司接了一個炒菜機器人的ODM(原始設備製造)業務,她想讓ChatGPT提供這個市場的預測數據,在反覆推拉后,ChatGPT還是沒有給她答案。而在寫工作郵件上,經過調教,ChatGPT也只給到她一個命令式的跟進郵件,文字官方式的長篇大論,也不是她想要的,她希望「它能寫出有禮貌的,信息表達很明確的郵件」。

  她覺得,ChatGPT之所以做不到,短板在於「不懂得人情世故」。得不到想要的結果,她的使用頻次也降低了,從一個星期五六次變爲了一周一次。

  當然,之所以會有這樣的體驗,背后綜合影響因素很多,和使用者是否問到了ChatGPT擅長的領域有關,也要看使用者有沒有找到與ChatGPT合適的交流方式。

  正在澳大利亞生活的Lucy,從去年底ChatGPT一推出后就開始用英文使用它。現在,她日常用ChatGPT來整理學術研究上的思路、學習語言,是生活里必不可少的工具。只是,準確性的問題一直讓她煩惱,文獻參考需要自己找,「如果我質疑它的回答,它就會順着我的思路回答」。

  除了ChatGPT的使用體驗感受不一,從數據來看,ChatGPT的普及率,暫時也還沒有想象中的廣。

  摩根士丹利相關報告截圖

  除了摩根士丹利的報告,還有一些數據可以作為佐證。根據SimilarWeb數據,3月-5月,美國、日本是全球為ChatGPT貢獻流量份額最高的國家,分別位列第一、第三。不過,最近,美國的流量已經下滑了10.28%。

  ChatGPT的全球流量分佈 來源 / SimilarWeb數據

  美國方面,在5月底,皮尤研究中心發佈了一份調查,他們在今年3月中旬在1萬多名美國成年人當中展開調查,18%的人聽説過很多關於ChatGPT的事情,39%的人聽説過一點,42%的人根本沒有聽説過。

  而在日本,根據日本ICT市場調查諮詢機構MM總研的最新調查報告,5月24日-31日期間,以日本及美國企業所屬的13814名員工(其中,日本13412人、美國402人)為對象,進行的網絡調查結果是,日本企業的ChatGPT使用率僅7%,與美國企業的51%使用率相比,兩者相差高達44個百分點。

  日本企業中,近半數員工(46%)回答「不知道」ChatGPT,而即便知道ChatGPT,但回答「未使用」的比重也達42%。

  這些都是最近的報告,樣本量在1萬人左右。不過ChatGPT大熱后,全球關於它的使用報告眾多,觀點不一,甚至有的得出的是相反結論。上述報告有一定參考性,但也因地域和人羣的差別,不一定能完全反應真實情況。

  還有更明確的值得參考的整體性數據,可以幫助我們認識ChatGPT的應用現狀。

  根據SimilarWeb,ChatGPT增長明顯放緩,尤其到6月,截至6月20日,6月已經過去三分之二,訪問量比5月少了38%左右,粗略推算,到6月31日如果沒有特別新的刺激,6月的環比流量或將下降。

  ChatGPT近期流量變化 來源 / SimilarWeb數據

  同時,還可以參考的是,根據SimilarWeb,在5月,ChatGPT的跳出率是12.59%,低於谷歌、Youtube等,而在6月24日,跳出率已經上升到37.37%。平均訪問持續時間也從8分32秒,下降到7分48秒。

  另一個數據是,接入GPT大模型后Bing的市場份額變化。

  來源 / Statcounter

  Bing的市場佔有率,在二三月份剛引入GPT時引發關注,根據網站通訊流量監測機構Statcounter,2023年3月Bing的市場份額是2.86%,5月是2.77%,不僅佔比沒有提高,甚至還有下降趨勢。

  是什麼限制了ChatGPT?

  關於ChatGPT應用上的問題,已經老生常談,不過這些問題對它應用普及上的影響,或許比想象中廣。

  首先是「變笨」這件事。

  6月初,「ChatGPT變笨了」的聲音引發過討論。不過OpenAI開發者推廣大使Logan Kilpatrick曾出面迴應,表示自3月14日發佈GPT-4以來,大模型的本體一直處於靜態,不存在大量外部數據污染模型的情況。同時他也承認,大模型本身存在不穩定性,因此對相通的提示詞,存在回答前后不一致的情況。

  一位AI從業者告訴深燃,5月就有國外從業者在OpenAI論壇里分享論證GPT變笨的文章。最近,他用GPT-4的API做了測試,讓它做簡單的計算題。從結果準確度來看,GPT-4-0314取得了滿分,GPT-4取得了80分,GPT-4-0613,勉強可以拿50分。其中,0314、0613即指3月14號、6月13號的快照(指整個系統在某個時間點上的狀態)。這個結果,給他一種GPT-4在被削弱的感受。

  來源 / unsplash

  根據監管機構NewsGuard的專家分析,OpenAI最新版本的GPT-4,在輸出信息方面,比GPT-3.5要糟糕。在今年3月份發佈的報告中,NewsGuard提到,GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敍述,而且比GPT-3.5回答的內容更差。

  在上述AI行業從業者看來,這樣變化的結果是,用户需要變得更為具體和主動地引導GPT-4,才能獲得與過去相當的回答質量。

  這也再度影響ChatGPT的使用門檻,而這與ChatGPT的初衷有所背離。

  最開始ChatGPT爆火,就有業內人士對深燃分析,它帶來的影響是將通用人工智能放在了每個用户面前,也把人機交互的門檻,打到了最低點。

  但目前來看,門檻還是存在。從ChatGPT的用户畫像,也能看出這個產品的普及情況。根據SimilarWeb數據,使用者主要分佈在計算機電子與技術行業,其中,編程和軟件開發佔比最大。其他行業里,只有遊戲行業中的視頻遊戲機和配件的從業者佔比較多。

  在使用ChatGPT的體驗上,一位工程師給深燃的反饋最為積極,表示一直在用,「能幫我解決小的程序上的問題」。

  儘管都説,「淘汰你的不是AI,是會用AI的人」,如果普通人使用起來門檻越來越高,那也一定程度上脱離了ChatGPT的初衷。

  還有兩個問題,是ChatGPT從最開始就面臨的質疑,即準確率和隱私保護。

  根據上述日本相關機構的報告,在被問到今后若要繼續/擴大使用ChatGPT,需要解決什麼問題時,日本企業、美國企業分別有高達49%、45%的回答是「案件的精度」,其次為「個人資料等隱私(日企34%、美企35%)」,和「對問題的理解程度(日企33%、美企34%)」。

  準確度方面,OpenAI的CEO山姆·奧特曼,也做出過解釋,這個程序會自信地宣稱一些東西是事實,但其實它是編造出來的,就像謊話連篇的政客一樣。他給這種現象起了個名字——「幻覺難題」。

  總之,準確率要實現起來非常不容易。原因就是因為它不是靠記憶,而是憑藉演繹推理能力來工作。「大語言模型靠的是推理的拼字遊戲,不可能像數據庫一樣完全準確,人也不能完全保證準確」,關注AI行業的工程師楊陽告訴深燃。

  隱私方面,OpenAI至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃,公司特地發郵件通知,讓大家謹慎使用ChatGPT。

  基於這些限制,ChatGPT的應用場景也受限制。

  關注產業的投資人陳默默告訴深燃,它其實適合「生產力驅動」的內容生產,而不是「創意驅動」的內容生產,在前者上,能替代不少有重複經驗累積的人力。

  用户洛洛從4月開始使用ChatGPT,她開了會員,主要用於寫腳本和文案,「只要能給它正確的公式,基本可以反饋給我任意思維的腳本,只是拿到手要改」。她表示,產出的腳本比較基礎,沒法做成爆款,但它邏輯沒有問題,「像公司日常的一些大量的視頻輸出,是可以支持的」,她現在的ChatGPT使用頻率,基本上一周3次以上。

  現在夏楠調整了策略,只問它一些流程式的問題,比如開ebay網店的流程。儘管這類問題也可以問谷歌、百度,但「ChatGPT的回答更好」,她舉例,最近她去德國旅行,讓ChatGPT給她安排旅遊計劃,給出的答案有參考性,交通安排的也很清楚。

  這些長期使用ChatGPT的用户,不論對ChatGPT的使用體驗滿意與否,他們都提到,ChatGPT更像是一個升級了的谷歌、百度,帶來了一定助力。

  ChatGPT,象徵意義高過實質意義?

  最近,OpenAI推出了類似於LLM版的App Store,加速生態的建設,還被曝光了一些功能上的優化。這背后也隱藏着一個信號,GPT4暫時已經到天花板,要加速生態建設,在GPT5出不來之前,先做一些體驗上的優化。

  早在4月,山姆·奧特曼就表示,還沒有開始研究GPT-5,也沒有立即開始的打算,還曾表示,「大型模型時代已經到頭了。」

  據OpenAI官網,GPT模型參數數量(可以理解為餵養模型的語言材料)在不斷提升。GPT-1是1.17億,GPT-2有15億,到了GPT-3,飆升至1750億,GPT-4,根據國外媒體機構Semafor的一份報告,比GPT-3大六倍左右,具有1萬億個參數。

  此前楊陽也對深燃表示,或許GPT-4就成長到頭了,語料是一個原因,「人類歷史上創造出的優秀資源就這些了」,模型本身的限制也是一個原因。在他看來,現在GPT-4被限制了,應該有能力沒有被完全開發出來。

  近日,Facebook母公司Meta首席人工智能科學家Yann LeCun就指出,ChatGPT背后的生成式人工智能技術已進入了死衚衕,擁有太多的侷限性。

  出於巨頭間的競爭關係,或許很難將這話作為客觀參考。但可以肯定的是,ChatGPT的確遇到了瓶頸。

  要讓大語言模型有更好的應用,不少人把視線投向垂直領域的應用上。

  AI行業從業者秦凱對深燃做了一個比喻,ChatGPT這類泛化型的人工智能,應用寬泛時,能力就像是高中生、大學生,和垂直場景結合時,fine-tuning(在自然語言處理中使用的技術,也叫微調)的數據足夠精確和貼合場景,能力就能變為碩士、博士,能解決更具體的需求。

  楊陽也認同這一看法。他提到,目前的模型最多隻能進行一倍左右的優化,「大家有一個基礎共識,GPT-5來了,也不會帶來顛覆性的進化」,短期內不可能達到AGI(通用人工智能)水平。

  來源 / unsplash

  不過,他表示,現在做具體垂類應用,首先是費用高,訓練模型對公司來説依舊是不小的成本;其次是數據安全、數據隔離的問題,目前採用的辦法是,「在大模型基礎上套小模型」,但帶來的問題是,現在的底層技術還在變化,「沒有人知道下一個模型,更優秀的模型什麼時候出現」,這個中間階段讓大家很迷茫,「如果三五年后纔出現,那現在基於大模型做垂類的產品是不虧的,場景落地后有機會回收資金。但如果很快就出現了,那大家現在做的外掛型垂類產品,是沒有多少意義的。」

  投資人陳默默表示,這是一個「先有雞還是先有蛋」的問題,他們還是願意去看相關項目,在細分領域里切一個特定場景的應用,因為「哪怕未來的底層有變化,只要行業沒有變動,在應用層的行業理解上還是會有沉澱」。

  但他們在看項目時遇到的問題是,很難有人可以明確告訴他們,產品能節省多少人力成本。「看下來,還是得給機器配個人」,她舉例,關注賦能研發端論文篩選歸納相關的垂類產品,實際使用也還是需要一個人順着機器的結果,再做進一步驗真、開發和研究,實際上很難説效率有特別好的優化」,所以現在,一些投資人都會傾向於再觀望觀望。

  在關注垂類領域的AI創業公司的產品時,她的感受是,「我們對技術帶來的產業升級機會保持謹慎樂觀,目前可能它的市場意義,高過實質意義」。

  秦凱總結,人們對ChatGPT的期望過高,但有兩個瓶頸。首先,下一代大語言模型通過更大的參數規模和更強算力的收益邊際遞減,人們的期望可能無法很快滿足。其次,當前的大語言模型是泛化的,需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI,已經變成了針對具體企業做定製化需求和私有部署的體力活,「底層模型依靠transformer方式缺乏解決非常複雜問題的能力,現在的應用情況與預期的水平相距甚遠」。

  應用還在繼續,技術還在發展,關於ChatGPT的應用及潛力還需要再觀望。即便是這樣,ChatGPT已經讓一些人的生產效率,有了一個數量級的提高,即便當下有瓶頸,「ChatGPT已經是很偉大的產品,這就夠了。」楊陽表示。

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。