熱門資訊> 正文

ChatGPT也漲不動了

2023-06-25 08:59

　　深燃（shenrancaijing）原創

　　作者 | 李秋涵

　　編輯 | 魏佳

　　你還在用ChatGPT嗎？

　　在全球掀起AI熱潮的ChatGPT，似乎進入了瓶頸期。

　　首先是關於ChatGPT的使用率，有不利的數據出現。6月初，摩根士丹利發佈的一項調查顯示，只有19%的受訪者表示他們之前使用過ChatGPT，只有4%的人表示依賴ChatGPT。調查表示，比例低的驚人。

　　這項調查在今年4月進行，涉及人數為2000人。不過，在全球78億人口面前，這樣的樣本量不算大，也一定程度上降低了其參考性。

　　還有一個基數更廣泛的數據值得關注，ChatGPT的增長已經明顯放緩。

　　根據網站數據分析工具SimilarWeb數據，前期ChatGPT的訪問量增長率驚人，1月份的環比增長率為131.6%，2月份為62.5%，3月份為55.8%，在4月份明顯放緩，環比增長率為12.6%，到了5月，這個數字已經變爲了2.8%。

　　隨着ChatGPT普及，參考基數變大，增長率放緩是正常現象，不過，根據目前已有的趨勢來看，6月的環比增長率也有可能為負數。

　　今年年初，ChatGPT像一聲驚雷，讓全球見識到了生成式AI的威力，也讓背后的GPT（生成式預訓練Transfomer模型）大火，掀起大模型創業潮。它刷新了很多數字，最讓人印象深刻的，是史上用户增長速度最快的消費級應用，在推出僅兩個月后，ChatGPT的月活用户已經突破了1億。

　　但對它未來的發展，即便是創造者也很難給出明確答案。此前OpenAI董事會成員海倫·托勒就曾表示，「甚至創造它們的人也不知道它們能做什麼，不能做什麼。我預計，我們真正瞭解GPT-4能做和不能做的所有事情，可能還需要幾年時間。」

　　ChatGPT現在的天花板，不代表就是GPT的天花板，但作為目前最厲害的大語言模型支撐的產品，ChatGPT的走向，也能成為觀察GPT應用的一個窗口。關於AI的狂想還在繼續，時間已經過去了近半年，我們好奇的是，ChatGPT的使用情況到底如何？它被高估了嗎？

　　ChatGPT真的很多人用嗎？

　　對於ChatGPT的使用體驗，不同行業、不同人答案不同。有人把它當玩具，使用了一兩次后就不再登錄；有人努力把它變為工具，在工作中以提高效率；也有人，在努力將ChatGPT變為工具的過程中失敗了，因為覺得它「不夠好用」。

　　夏楠屬於第三種。她從事外貿行業，會用ChatGPT寫工作郵件，也會讓它解答一些生活中的煩惱，爲了能更好的使用ChatGPT，她都是用英文發指令。

　　從2月開始使用ChatGPT，她的體驗分爲了三個階段，最開始是好奇，很多問題都想拋給ChatGPT，看它怎麼回答，探索它。從5月開始，她感覺ChatGPT「變笨了」，之前能做到的，現在做不到了。現在，她對ChatGPT的評價是，「不好用」。

　　比如最近，他們公司接了一個炒菜機器人的ODM（原始設備製造）業務，她想讓ChatGPT提供這個市場的預測數據，在反覆推拉后，ChatGPT還是沒有給她答案。而在寫工作郵件上，經過調教，ChatGPT也只給到她一個命令式的跟進郵件，文字官方式的長篇大論，也不是她想要的，她希望「它能寫出有禮貌的，信息表達很明確的郵件」。

　　她覺得，ChatGPT之所以做不到，短板在於「不懂得人情世故」。得不到想要的結果，她的使用頻次也降低了，從一個星期五六次變爲了一周一次。

　　當然，之所以會有這樣的體驗，背后綜合影響因素很多，和使用者是否問到了ChatGPT擅長的領域有關，也要看使用者有沒有找到與ChatGPT合適的交流方式。

　　正在澳大利亞生活的Lucy，從去年底ChatGPT一推出后就開始用英文使用它。現在，她日常用ChatGPT來整理學術研究上的思路、學習語言，是生活里必不可少的工具。只是，準確性的問題一直讓她煩惱，文獻參考需要自己找，「如果我質疑它的回答，它就會順着我的思路回答」。

　　除了ChatGPT的使用體驗感受不一，從數據來看，ChatGPT的普及率，暫時也還沒有想象中的廣。

　　摩根士丹利相關報告截圖

　　除了摩根士丹利的報告，還有一些數據可以作為佐證。根據SimilarWeb數據，3月-5月，美國、日本是全球為ChatGPT貢獻流量份額最高的國家，分別位列第一、第三。不過，最近，美國的流量已經下滑了10.28%。

　　ChatGPT的全球流量分佈來源 / SimilarWeb數據

　　美國方面，在5月底，皮尤研究中心發佈了一份調查，他們在今年3月中旬在1萬多名美國成年人當中展開調查，18%的人聽説過很多關於ChatGPT的事情，39%的人聽説過一點，42%的人根本沒有聽説過。

　　而在日本，根據日本ICT市場調查諮詢機構MM總研的最新調查報告，5月24日-31日期間，以日本及美國企業所屬的13814名員工（其中，日本13412人、美國402人）為對象，進行的網絡調查結果是，日本企業的ChatGPT使用率僅7%，與美國企業的51%使用率相比，兩者相差高達44個百分點。

　　日本企業中，近半數員工（46%）回答「不知道」ChatGPT，而即便知道ChatGPT，但回答「未使用」的比重也達42%。

　　這些都是最近的報告，樣本量在1萬人左右。不過ChatGPT大熱后，全球關於它的使用報告眾多，觀點不一，甚至有的得出的是相反結論。上述報告有一定參考性，但也因地域和人羣的差別，不一定能完全反應真實情況。

　　還有更明確的值得參考的整體性數據，可以幫助我們認識ChatGPT的應用現狀。

　　根據SimilarWeb，ChatGPT增長明顯放緩，尤其到6月，截至6月20日，6月已經過去三分之二，訪問量比5月少了38%左右，粗略推算，到6月31日如果沒有特別新的刺激，6月的環比流量或將下降。

　　ChatGPT近期流量變化來源 / SimilarWeb數據

　　同時，還可以參考的是，根據SimilarWeb，在5月，ChatGPT的跳出率是12.59%，低於谷歌、Youtube等，而在6月24日，跳出率已經上升到37.37%。平均訪問持續時間也從8分32秒，下降到7分48秒。

　　另一個數據是，接入GPT大模型后Bing的市場份額變化。

　　來源 / Statcounter

　　Bing的市場佔有率，在二三月份剛引入GPT時引發關注，根據網站通訊流量監測機構Statcounter，2023年3月Bing的市場份額是2.86%，5月是2.77%，不僅佔比沒有提高，甚至還有下降趨勢。

　　是什麼限制了ChatGPT？

　　關於ChatGPT應用上的問題，已經老生常談，不過這些問題對它應用普及上的影響，或許比想象中廣。

　　首先是「變笨」這件事。

　　6月初，「ChatGPT變笨了」的聲音引發過討論。不過OpenAI開發者推廣大使Logan Kilpatrick曾出面迴應，表示自3月14日發佈GPT-4以來，大模型的本體一直處於靜態，不存在大量外部數據污染模型的情況。同時他也承認，大模型本身存在不穩定性，因此對相通的提示詞，存在回答前后不一致的情況。

　　一位AI從業者告訴深燃，5月就有國外從業者在OpenAI論壇里分享論證GPT變笨的文章。最近，他用GPT-4的API做了測試，讓它做簡單的計算題。從結果準確度來看，GPT-4-0314取得了滿分，GPT-4取得了80分，GPT-4-0613，勉強可以拿50分。其中，0314、0613即指3月14號、6月13號的快照（指整個系統在某個時間點上的狀態）。這個結果，給他一種GPT-4在被削弱的感受。

　　來源 / unsplash

　　根據監管機構NewsGuard的專家分析，OpenAI最新版本的GPT-4，在輸出信息方面，比GPT-3.5要糟糕。在今年3月份發佈的報告中，NewsGuard提到，GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敍述，而且比GPT-3.5回答的內容更差。

　　在上述AI行業從業者看來，這樣變化的結果是，用户需要變得更為具體和主動地引導GPT-4，才能獲得與過去相當的回答質量。

　　這也再度影響ChatGPT的使用門檻，而這與ChatGPT的初衷有所背離。

　　最開始ChatGPT爆火，就有業內人士對深燃分析，它帶來的影響是將通用人工智能放在了每個用户面前，也把人機交互的門檻，打到了最低點。

　　但目前來看，門檻還是存在。從ChatGPT的用户畫像，也能看出這個產品的普及情況。根據SimilarWeb數據，使用者主要分佈在計算機電子與技術行業，其中，編程和軟件開發佔比最大。其他行業里，只有遊戲行業中的視頻遊戲機和配件的從業者佔比較多。

　　在使用ChatGPT的體驗上，一位工程師給深燃的反饋最為積極，表示一直在用，「能幫我解決小的程序上的問題」。

　　儘管都説，「淘汰你的不是AI，是會用AI的人」，如果普通人使用起來門檻越來越高，那也一定程度上脱離了ChatGPT的初衷。

　　還有兩個問題，是ChatGPT從最開始就面臨的質疑，即準確率和隱私保護。

　　根據上述日本相關機構的報告，在被問到今后若要繼續/擴大使用ChatGPT，需要解決什麼問題時，日本企業、美國企業分別有高達49%、45%的回答是「案件的精度」，其次為「個人資料等隱私(日企34%、美企35%)」，和「對問題的理解程度(日企33%、美企34%)」。

　　準確度方面，OpenAI的CEO山姆·奧特曼，也做出過解釋，這個程序會自信地宣稱一些東西是事實，但其實它是編造出來的，就像謊話連篇的政客一樣。他給這種現象起了個名字——「幻覺難題」。

　　總之，準確率要實現起來非常不容易。原因就是因為它不是靠記憶，而是憑藉演繹推理能力來工作。「大語言模型靠的是推理的拼字遊戲，不可能像數據庫一樣完全準確，人也不能完全保證準確」，關注AI行業的工程師楊陽告訴深燃。

　　隱私方面，OpenAI至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃，公司特地發郵件通知，讓大家謹慎使用ChatGPT。

　　基於這些限制，ChatGPT的應用場景也受限制。

　　關注產業的投資人陳默默告訴深燃，它其實適合「生產力驅動」的內容生產，而不是「創意驅動」的內容生產，在前者上，能替代不少有重複經驗累積的人力。

　　用户洛洛從4月開始使用ChatGPT，她開了會員，主要用於寫腳本和文案，「只要能給它正確的公式，基本可以反饋給我任意思維的腳本，只是拿到手要改」。她表示，產出的腳本比較基礎，沒法做成爆款，但它邏輯沒有問題，「像公司日常的一些大量的視頻輸出，是可以支持的」，她現在的ChatGPT使用頻率，基本上一周3次以上。

　　現在夏楠調整了策略，只問它一些流程式的問題，比如開ebay網店的流程。儘管這類問題也可以問谷歌、百度，但「ChatGPT的回答更好」，她舉例，最近她去德國旅行，讓ChatGPT給她安排旅遊計劃，給出的答案有參考性，交通安排的也很清楚。

　　這些長期使用ChatGPT的用户，不論對ChatGPT的使用體驗滿意與否，他們都提到，ChatGPT更像是一個升級了的谷歌、百度，帶來了一定助力。

　　ChatGPT，象徵意義高過實質意義？

　　最近，OpenAI推出了類似於LLM版的App Store，加速生態的建設，還被曝光了一些功能上的優化。這背后也隱藏着一個信號，GPT4暫時已經到天花板，要加速生態建設，在GPT5出不來之前，先做一些體驗上的優化。

　　早在4月，山姆·奧特曼就表示，還沒有開始研究GPT-5，也沒有立即開始的打算，還曾表示，「大型模型時代已經到頭了。」

　　據OpenAI官網，GPT模型參數數量（可以理解為餵養模型的語言材料）在不斷提升。GPT-1是1.17億，GPT-2有15億，到了GPT-3，飆升至1750億，GPT-4，根據國外媒體機構Semafor的一份報告，比GPT-3大六倍左右，具有1萬億個參數。

　　此前楊陽也對深燃表示，或許GPT-4就成長到頭了，語料是一個原因，「人類歷史上創造出的優秀資源就這些了」，模型本身的限制也是一個原因。在他看來，現在GPT-4被限制了，應該有能力沒有被完全開發出來。

　　近日，Facebook母公司Meta首席人工智能科學家Yann LeCun就指出，ChatGPT背后的生成式人工智能技術已進入了死衚衕，擁有太多的侷限性。

　　出於巨頭間的競爭關係，或許很難將這話作為客觀參考。但可以肯定的是，ChatGPT的確遇到了瓶頸。

　　要讓大語言模型有更好的應用，不少人把視線投向垂直領域的應用上。

　　AI行業從業者秦凱對深燃做了一個比喻，ChatGPT這類泛化型的人工智能，應用寬泛時，能力就像是高中生、大學生，和垂直場景結合時，fine-tuning（在自然語言處理中使用的技術，也叫微調）的數據足夠精確和貼合場景，能力就能變為碩士、博士，能解決更具體的需求。

　　楊陽也認同這一看法。他提到，目前的模型最多隻能進行一倍左右的優化，「大家有一個基礎共識，GPT-5來了，也不會帶來顛覆性的進化」，短期內不可能達到AGI（通用人工智能）水平。

　　來源 / unsplash

　　不過，他表示，現在做具體垂類應用，首先是費用高，訓練模型對公司來説依舊是不小的成本；其次是數據安全、數據隔離的問題，目前採用的辦法是，「在大模型基礎上套小模型」，但帶來的問題是，現在的底層技術還在變化，「沒有人知道下一個模型，更優秀的模型什麼時候出現」，這個中間階段讓大家很迷茫，「如果三五年后纔出現，那現在基於大模型做垂類的產品是不虧的，場景落地后有機會回收資金。但如果很快就出現了，那大家現在做的外掛型垂類產品，是沒有多少意義的。」

　　投資人陳默默表示，這是一個「先有雞還是先有蛋」的問題，他們還是願意去看相關項目，在細分領域里切一個特定場景的應用，因為「哪怕未來的底層有變化，只要行業沒有變動，在應用層的行業理解上還是會有沉澱」。

　　但他們在看項目時遇到的問題是，很難有人可以明確告訴他們，產品能節省多少人力成本。「看下來，還是得給機器配個人」，她舉例，關注賦能研發端論文篩選歸納相關的垂類產品，實際使用也還是需要一個人順着機器的結果，再做進一步驗真、開發和研究，實際上很難説效率有特別好的優化」，所以現在，一些投資人都會傾向於再觀望觀望。

　　在關注垂類領域的AI創業公司的產品時，她的感受是，「我們對技術帶來的產業升級機會保持謹慎樂觀，目前可能它的市場意義，高過實質意義」。

　　秦凱總結，人們對ChatGPT的期望過高，但有兩個瓶頸。首先，下一代大語言模型通過更大的參數規模和更強算力的收益邊際遞減，人們的期望可能無法很快滿足。其次，當前的大語言模型是泛化的，需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI，已經變成了針對具體企業做定製化需求和私有部署的體力活，「底層模型依靠transformer方式缺乏解決非常複雜問題的能力，現在的應用情況與預期的水平相距甚遠」。

　　應用還在繼續，技術還在發展，關於ChatGPT的應用及潛力還需要再觀望。即便是這樣，ChatGPT已經讓一些人的生產效率，有了一個數量級的提高，即便當下有瓶頸，「ChatGPT已經是很偉大的產品，這就夠了。」楊陽表示。

（聲明：本文僅代表作者觀點，不代表新浪網立場。）

ChatGPT也漲不動了

推薦文章

提價83%需求卻暴增400%！智譜、MiniMax鎖定大模型定價權，AI Agent元年即將開啟？

港股見底了嗎？北水大舉加倉逾600億港元！大行看好4月做多窗口來臨，十大金股一圖睇全

華盛早報 | 伊朗與阿曼擬共管霍爾木茲！美股V型反轉；伊朗襲擊甲骨文、亞馬遜數據中心；港美股今日因假期休市一天

諾和諾德稱：口服版Wegovy減肥效果優於禮來GLP‑1口服藥

美股機會日報 | 特朗普粉碎停戰幻想！恐慌指數飆升12%，納指期貨跌約2%；美油期貨暴漲超9%！油氣股飆升，美國原油基金ETF漲超9%

清明休市提醒 | 港股本周五休市，下周三恢復交易；美股周五休市一天

油價上漲 此前特朗普表示伊朗衝突可能在未來幾周升級

野村：特朗普講話未能發出局勢降温的明確信號

油價上漲此前特朗普表示伊朗衝突可能在未來幾周升級