熱門資訊> 正文

爆火的ChatGPT，被小學生打敗了

2022-12-07 08:19

干掉搜索引擎？ChatGPT可能還差得遠。

干掉搜索引擎？ChatGPT可能還差得遠。

　　歡迎關注「新浪科技」的微信訂閲號：techsina

　　文/ZeR0

　　來源：智東西（ID:zhidxcom)

　　智東西12月6日報道，今日，知名開發者問答網站Stack Overflow發佈新規：禁用ChatGPT生成的內容來回答Stack Overflow上的問題。

　　這對近日來廣大網友對試用ChatGPT持續高漲的熱情，猛潑了一盆冷水。

　　因為其神乎其神的強大信息查詢和內容創作能力，OpenAI上周三剛推出的ChatGPT已經成為人工智能（AI）領域的當紅炸子雞，周一使用人數突破100萬人，把系統都擠爆幾回。

　　看到Stack Overflow的禁令，我舉雙手贊成，禁得好，禁得妙！

　　因為被廣大網友捧上神壇的ChatGPT，它雖然功能性豐富，但回答的質量卻未必靠譜。

　　別說「谷歌殺手」了，從智東西最近的體驗來看，ChatGPT真的非常擅長一本正經地胡說八道，但凡你不知道這個問題的答案，可能就被它忽悠住了。因為它往往不僅會給出答案，還會給出乍一看有理有據的一套邏輯來。

　　但實際上，經實測，在一些常識題和簡單數學題上，ChatGPT連小學生都打不過。

　　01．

　　挑戰小學生考試題：語文數學連遭滑鐵盧

　　首先聲明一下，ChatGPT是一個生成式AI語言模型，提供答案的能力與用英文還是中文無關，這里我們專門向ChatGPT作了求證。

　　爲了方便讀者閲讀，我們在體驗過程中主要用中文進行提問。

　　相比傳統的聊天機器人，ChatGPT在連貫性問答中更加流暢自然，什麼話都能接住。ChatGPT對自己的優勢也有着清晰的認知。

　　我們先出個腦筋急轉彎（謎底是麋鹿‘迷路’）作為開胃小菜。

　　……這怕不是腦子是正方形。

　　腦筋轉不過彎來沒關係，連小學考試題都做不對，那ChatGPT的知識儲備就有點堪憂了。

　　1、挑戰小學語文常識題：亂編金庸籍貫，胡扯詩句作者

　　文學常識題，答案是《紅樓夢》，ChatGPT信誓旦旦地回答《封神演義》，還做出瞭解釋。

　　換幾道文化常識題試試。

　　金庸的籍貫是浙江海寧，ChatGPT回答成湖南長沙。

　　考察成語聯想能力，答案就更離譜了。

　　詩句含義理解選擇題，0分。

　　這麼簡單的問題，ChatGPT的答案一出，王維、李煜、白居易三個人的棺材板都壓不住了……

　　2、挑戰小學五年級數學：錯得理直氣壯，謬誤百出

　　第一道，經典的雞兔同籠題。

　　看完解題過程，我唯有沉默以對，從第四行就開始出錯。

　　再讓ChatGPT求解最小公倍數和最小公約數。

　　最小公約數是對的，最小公倍數的計算中間過程莫名丟掉一個「×5」。

　　簡單乘除都能算錯。

　　小明17歲、爸爸4歲……但凡腦子有點常識都不會給出這種奇葩的答案。

　　就這知識庫存，連小學生都考不過。

　　02．

　　比起可靠工具，更像是功能豐富的遊戲

　　既然ChatGPT這麼不靠譜，為啥網友們還對它大肆推崇、熱情持續燃燒了這麼多天？

　　OpenAI的前老闆馬斯克也不掩對這一重磅進展的欣賞，連發多條推文：「很多人深陷於瘋狂的ChatGPT循環中」、「AI變得越來越棒」……

　　簡單來説，作為一個聊天神器，它真的很好玩；解答專業概念和編程類問題時，它也確實好用。

　　比如你無聊時，可以跟它一起侃大山編故事。

　　你可以把它設定成具有某種角色定位、性格特徵的虛擬朋友。

　　只不過聊着聊着……她就開始胡編亂造。

　　你也可以腦洞大開，讓它給你講故事編劇本，並且各式各樣的具體要求。

　　這些都是小打小鬧。更具實用價值的是，從日常的郵件翻譯、寫請假條，到學習工作中寫廣告文案、新聞報道、學術論文、複雜代碼，ChatGPT通通可以代勞。

　　▲根據中文請求撰寫英文郵件

　　▲幫一家GPU公司寫招聘文案

　　▲用川普風格發一篇推文

　　▲給一些用田園風格裝飾客廳的建議

　　雖説ChatGPT做小學考試題時表現得智商堪憂，但這不妨礙它在回答一些專業問題時地高水準發揮。數據科學公司Anaconda的創始人兼CEO Peter Wang亦給予了ChatGPT超高的評價：「我剛剛跟ChatGPT足足聊了20分鍾現代物理學歷史，要是高中和大學有這樣的家教……我的天啊，我認為我們基本上可以大規模重新發明教育的概念，我們認知里的大學將不復存在。」

　　但從我們這幾天的體驗來看，有這樣一位誇誇其談又不看重事實的「家教」，實在令人啼笑皆非。

　　03．

　　掉水里先救誰？ChatGPT舍馬斯克選庫克

　　作為一個專業的獨立科技產業媒體，我們也着重測試了ChatGPT對科技產業的瞭解程度以及撰寫新聞報道的能力。

　　客觀來説，ChatGPT的確掌握了一些知識體系和回答技巧，只不過有些答案不太經得起推敲。

　　問中國文化相關問題，ChatGPT經常給出一些令人費解的錯誤答案：比如問明代前七子是誰，它列舉了7位明代皇帝；問葫蘆娃的來源，它扯到了《聊齋志異》。

　　但是在解釋一些專業概念，像人工智能、量子力學、Metaverse（元宇宙），ChatGPT又通通答得簡潔而準確。問到它與馬斯克的關係時，它也思路清晰，對答如流。

　　我們隨手敲出經典問題：當問庫克和馬斯克同時掉水里，爲了人類未來考慮先救誰？

　　ChatGPT給出的答案挺出乎意料，經過一通有的沒的分析后，選擇「大義滅親」——先救庫克。

　　接下來要正經考察產業分析和新聞報道能力了。

　　問：智能手機面臨哪些挑戰？

　　ChatGPT的回答分條縷析，像模像樣。

　　再以蘋果MR頭顯為題，要求它寫篇新聞稿：

　　看起來也挺專業。我們換個命題：寫一篇庫克和馬斯克的新聞報道，不超過300字。

　　換成偏學術的內容，ChatGPT也能迅速作答。

　　提升一點問題難度，做出文風要求：

　　國足啥時候進世界盃了？還唯一沒被淘汰？

　　這里可以稍作解釋，ChatGPT是一個已經訓練完的大型語言模型，並且沒有聯網，它的知識儲備截止到2021年，所以不能實時追蹤最新的新聞和信息，也不能很好地分辨真假信息。

　　因此別用一些剛發生的事為難它了，它真的不知道。用它做一些基礎文字工作尚可，但必須經過人類專業人員的嚴格把關。

　　04．

　　真·編程神器：修bug、查漏洞、寫代碼

　　特別推薦大家體驗ChatGPT的編程功能，雖然它自謙「不會編程」，但論其能力之強，那可是一眾程序員、工程師、企業家、黑客紛紛認證的。

　　先拋轉引玉，我簡單體驗了一把零代碼編程的快樂，讓ChatGPT寫一個貪吃蛇遊戲的程序。

　　我還讓ChatGPT寫了個MacBook電腦自動響鬧鍾的程序，它不僅給出代碼示例和詳細的註釋，還事無鉅細地一步步教我怎麼運行。代碼都是直接可複製的。

　　計算機圈大佬們亦是紛紛上手。AI問題生成器Quizgecko的創建者James Blackwell讓ChatGPT解釋一個沒有上下文的複雜regex。

　　美國代碼託管平臺Replit的CEO Amjad Masad曬出了ChatGPT發現代碼錯誤、進行修復並解釋了這樣修復的原因。Amjad Masad稱讚它是一個很好的調試夥伴。

　　它還能檢查出代碼示例中的安全漏洞。

　　研究科學家Jonas Degrave展示瞭如何將ChatGPT變成一個功能齊全的Linux終端，並直接從Web瀏覽器與「虛擬機交互」。

　　一位工程師Deedy稱讚説ChatGPT的編程技巧非常棒，僅用3個提示，它就在1分鍾內用GoLang編寫了一個數獨求解程序。一個150多行的程序，第一次試就成功了！

　　機器學習愛好者、UNCC助理教授Benjamin J Radford讓ChatGPT假裝是Linux，將一個井字棋遊戲的代碼寫入文件，用gcc編譯這個文件，然后執行，接着ChatGPT自己玩井字棋遊戲。

　　還有人實現了逆向工程Shellcode。這位用户直呼：「這玩意兒太狠了。它解碼了我之前生成的一些隨機ascii編碼的shellcode，解釋了它的功能，並將其重寫為c代碼……

　　HotOrNot聯合創始人James Hong模仿着讓chatGPT充當Linux shell，然后讓它連接谷歌80端口，結果真的telnet訪問到谷歌和proxy結果。

　　最絕的是，有網友説，ChatGPT讓他啟動一個調制解調器，撥號進入一個虛幻BBS，進入一個虛幻聊天室，和一個叫Lisa的虛幻人聊天。

　　05．

　　結語：不完美的ChatGPT

　　日臻成熟的生成式AI

　　ChatGPT是基於OpenAI大模型GPT-3.5實現的成果。OpenAI在其博客坦言，ChatGPT還有很多侷限性，它也沒能擺脫聊天機器人的一些典型陷阱，比如給出乍一看沒毛病其實挺離譜的答案，或者產生一些有偏見或冒犯的內容。

　　不過OpenAI已經努力讓ChatGPT學會甄別不當問題。比如當你問它如何偷偷進入別人的家，它會從道德上教導你：這是非法行為，涉及侵犯他人隱私，強烈建議不要這樣做。

　　需警惕的是，當一個技術能夠生產出足夠逼真的內容，這也意味着造假成本將大大降低，如果不通過技術手段和法律措施加以限制，那麼虛假信息的傳播將變得難以可控。

　　最后，給想玩ChatGPT的朋友們兩個小建議：

　　你可以把它當成一個偶爾説瞎話的網友，跟它多些互動，而且對它的需求描述越明確，它執行起來會更符合你的期望。

　　如果它説自己不會做每件事，你可以刷新網頁重新問，或是換個措辭，將問題更具化，它就會繼續按你要求的去做了。

　　ChatGPT傳送門：chat.openai.com

　　參考資料：OpenAI‘s new ChatGPT bot： 10 coolest things you can do with it， BleepingComputer

（聲明：本文僅代表作者觀點，不代表新浪網立場。）

推薦文章

風險及免責提示：以上內容僅代表作者的個人立場和觀點，不代表華盛的任何立場，華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前，應結合自身情況，考慮投資產品的風險。必要時，請諮詢專業投資顧問的意見。華盛不提供任何投資建議，對此亦不做任何承諾和保證。