熱門資訊> 正文
2025-10-29 08:04
2024年8月,一本標註為 AI 繪製的繪本《卡皮巴拉的自我修養》上架微信讀書,一度排到新書榜第5名。AI 發展到今天,使用文生圖技術和人工智能協同創作繪本,不是一件值得驚訝的事。
但近期,人們可以使用自然語言描述自己想要的故事,AI可以在一分鍾內迅速完成繪本。
今年夏天,Gemini 推出Nano banana 模型,憑藉着出色的角色一致性能力,引發了眾多網友對 AI 圖像生成的探索和關注。在該模型曝光不久前,Gemini AI 上線了 Storybook 故事創作功能,用户僅需輸入幾句話描述情節,AI將自動生成10頁圖文內容的電子書。
圖像模型的完善使得人們逐漸開始探索AI繪本功能的妙用。在短視頻平臺上有大量 AI 繪本視頻,很多視頻附上英文字幕和配音,tag 標註為英語繪本、英語磨耳朵等,平均點贊量大幾千,有的視頻數據則近百萬。點開這些博主的主頁,往往掛着啓蒙繪本、英語繪本視頻合集等購買鏈接。
AI 一鍵生成的繪本能讀嗎?為什麼這些略顯抽象的幻燈片放映似的視頻能迅速走紅?爲了找到答案,我開始着手調研和試用產品。
爲了直觀體驗目前 AI 繪本技術的能力,我在 Google Gemini 里進行了一次測試。 點開AI繪本功能,界面上出現了幾個創作建議。
我隨手點擊了第三個關於「小蜜蜂」的創意概述。等待時間不到一分鍾,一個可以翻頁的電子繪本呈現在我面前。
繪本總共有十頁,講述了一個名叫巴奇的小蜜蜂的故事。儘管提示詞只有一個故事模糊的輪廓,但 AI 生成的故事邏輯是自洽的。講的是巴奇出門採蜜,遇到一個無精打采的小花,小蜜蜂採蜜后花兒重新抬起了頭,順暢地表明瞭蜜蜂活動有益。不過不得不承認,AI 生成的故事吸引力和趣味性不高,結構的「起承轉合」也不明顯,稱作「小故事大道理」更為合適。
之后我關注了一下「角色一致性」的問題,這是過去 AI 繪本製作的最大痛點。
在 Gemini 生成的故事里,主角巴奇的造型整體保持得不錯。雖然偶爾蜜蜂的造型和手的顏色會有些許出入,但完全沒有出現「角色突變」那種讓人詫異的硬傷。 如果對畫風不滿意,操作也很簡單。
現在漫畫的「大眼萌」風格略有恐怖谷風格,於是我接着要求 Gemini 更改風格,新的繪本很快也出爐了,整體畫風變為宮崎駿動漫風。
圖|新的風格
除了點擊推薦的指令生成故事繪本,我們也可以「先文后圖」。我用 Gemini 的文字 AI 功能生成了一個全新的故事腳本,再點開 Storybook 功能進行創作。
經我人工鑑別,AI生成的圖畫與腳本內容還是非常一致的。
圖|新的繪本
在「一站式繪本」的功能上新之前,我也嘗試過使用多個大模型製作 AI 繪本,只能説需要一定的耐心。
AI 創作繪本的核心是文生圖能力。從ChatGPT、DeepSeek等模型里拿到腳本,僅僅是第一步,最難的環節,是將其「喂」給文生圖 AI。
如果一次性投喂長腳本,AI 的多圖能力不足,角色一致性較差,會發生「一人千面」,所以創作者需要將故事拆解成一頁一頁,反覆修改提示詞,祈禱 AI 能穩定發揮。如果還想要流暢的配音,更要多工具協同,調取一個音頻 AI。
目前的模型「畫」得越來越快,並且正在解決一次性生成連續故事的問題。
當然,「卷」故事繪本的不止谷歌。國內文生圖模型也陸續升級,改善多圖生成的一致性問題,在生成連續故事的功能上有所完善。例如,字節跳動近期發佈的AI圖像生成模型 Seedream 4.0,稱其性能超越了谷歌的 Gemini 2.5 Flash Image,能一口氣免費輸出最多20張差異化圖像。這對批量生成 AI 繪本、視頻分鏡頭腳本等場景至關重要。
我用相同的 prompt 進行了測試。該模型可以直接在豆包上使用,出圖質量和圖像穩定性也有所保證,只是在部分複雜圖像中,角色形象不穩定,人像和動物搖擺不定。
在這些「一站式平臺」出現之前,不少 AI 自媒體博主將該場景拆分,兜售「AI繪本製作教程」。他們教人如何結合 Midjourney 等圖像模型,再搭配 ChatGPT、剪映,拼湊出一個完整的繪本。但這個模式軟件切換繁瑣、流程宂長、出圖效果不穩定、使用成本高昂,創作依舊複雜,想要擁有自己的繪本故事仍然困難。
現在,只要給 AI 一個概述、大綱或腳本,它基本都能生成一個邏輯自洽的故事,並配上高度符合場景的圖片,這使得 AI 繪本領域出現了越來越多新的創意。
AI 繪本的生意不止一種,但其初始形式和所有新興 AI 技術一樣,源自於一種焦慮。
在社交平臺,大量自媒體博主打出「AI學習」的標籤,將AI繪本等技術作為「副業」的一部分。他們利用信息差,將精美的 AI 圖片發帖「引流」吸引關注,再轉化關注者為消費者,以19.9元的價格售賣文生圖 AI 的插畫提示詞或教程等。
此外,部分博主直接將「AI繪本生意」作為宣傳亮點,走的是 AI 賣課路線。
我嘗試聯繫了一個社交媒體賬號,他們宣傳稱正在招募想要以 AI 繪本為副業的人。后來我加到一個企業微信號,對方自稱「AI XX 老師」,發來鏈接和海報,當晚就需要上線聽AI繪畫技巧公開直播課。
在AI繪本的應用中,人們除了最初的嘗試,往往還有更具實用性的需求。例如短視頻平臺很火的英語繪本系列,主打的就是通過圖文結合的方式幫助孩子更快地記住特定單詞。
另外,孤獨症等特殊需求羣體也值得關注。2024世界人工智能大會上,阿里通義展示了關照孤獨症兒童的 AI 繪本工具「追星星的 AI」。該工具可以生成常識認知、社交禮儀、心智解讀和趣味故事這四類內容的繪本,並可設置 3 個層級的認知水平。
在兒童教育領域,AI 繪本同樣是一項有力工具。圖文並茂的繪本可以激發小朋友的創造力和想象力,但目前市場上的傳統繪本在主題上相對趨同,難以滿足每一個家庭的需求。
在社交媒體上,很多帖子在求助給孩子看的繪本推薦,也有批判繪本價值觀充斥着刻板印象的避雷貼。一些家長希望孩子接觸性別平等等更廣闊的議題,擔憂市面上「總在讚美媽媽勤勞,誇獎爸爸勇敢」的繪本難以起到正確引導和教育作用。
AI 繪本產品出現后,許多不會畫插畫的普通人能將自己的想象力和創造力落地,創作出屬於自己孩子的定製繪本。
這一定製需求,自然成為目前 AI 繪本的重要發展方向。在某平臺,二十元一份的「AI十頁繪本代做」賣出超200份。AI 播客生成平臺 Listenhub 也開發了AI繪本產品,該產品的誕生來源於公司 CTO 自己的需求。孩子太喜歡聽故事,他便想到結合公司的 AI 音頻能力,加上各大前沿圖像模型,能夠一鍵演繹故事,製作出有聲繪本把想象傳遞給孩子。
AI+ 繪本產品童語故事開發者則是在一次和女兒去樂園遊玩的經歷后,突發奇想將遊玩的記錄變成了繪本。女兒很喜歡,還送給了同學讀,他之后便開發了這一繪本故事生成工具,提供給非專業內容創作者使用。
隨着一站式技術的完善,AI 繪本的生成更加便捷,人們的需求開始更加複雜和豐富。例如,Listenhub 支持電子翻頁繪本一鍵生成視頻繪本;在童語故事小程序創作繪本時,家長能夠在首頁看到其他創作者的作品,在流程中可以選擇孩子的年齡段,故事概要能使用 AI 推薦,畫面風格和角色也都有很多選項。如果家長的思考並不完善,相關功能可以給予提示和幫助。
這些產品被投射的關注,來自於人們對定製兒童繪本的需求,而不是繪本本身。家長想要看到「自己講述的故事」「孩子自己的故事」,在和 AI 的交互之中,那些獨一無二的繪本故事得以誕生。
這種需求也在揭示一個事實,AI 繪本的商業變現會開拓一種新的模式,和傳統繪本出版這條路並不相交。
專業插畫師 Dream 告訴刺蝟公社,AI 生成的繪本目前是達不到出版社要求的。一本傳統繪本基礎頁數要求是32頁,製作周期一般要一到兩年。AI 繪本很精緻,創作速度很快,但卻缺乏真實的表達;傳統繪本可能會在故事開頭的畫面適當留白,在高潮時配合豐富的畫面。繪本不只是文字與配圖放在一起,兩種表達會相互配合,帶給讀者童趣抑或是多元的感受,這背后的複雜創作是 AI 難以複製和展現的。
事實上,在紙媒下行的今天,繪本本身就不是一門「好生意」,許多插畫師都需依靠副業才能堅持創作。因此,AI 繪本生意的出現對傳統繪本行業反而衝擊較少。
多重因素疊加下,現在市場上用AI畫繪本不賺錢,真正賺錢的是「教人畫」以及「提供工具」。無論是賣19.9元的提示詞,還是收取會員費的一站式生成平臺,本質都是在售賣一種「能力」——一種在 AI 時代「人人皆可成為創作者」的能力,是家長們希望深度參與孩子成長的需求。
不過,作為「定製的藝術」,AI 繪本功能仍有待完善。
目前市場上的文生圖模型已經可以做到對單個圖進行修改,保持一定的穩定性。但無法對10頁的繪本里單獨的頁面進行刪改,必須重新從文字腳本和畫面描述進行修改。
我在實際操作中進行了嘗試。當我讓 Gemini 去掉第三頁的文本時,它乾脆地拒絕了我,我又讓它修改封面時,它答應得爽快,但實際顯示的畫面並沒有改變。
除此之外,AI 繪本的核心使用場景是「兒童成長」,而它最大的風險,在於大模型的「黑盒問題」。和大模型合作創作內容時,模型背后的價值判斷很難察覺,這些 AI不是全然正確和沒有偏見的。
大模型是基於海量數據訓練的結果,數據中固有的不道德與偏見已經在訓練里自動形成。已有研究發現,未經過規範的語言模型存在道德感缺失,在面臨簡單的日常情境倫理判斷問題時準確率僅有60.2%,這對兒童教育來説無疑存在風險。
每一個故事背后都暗含表達,無論是 AI 還是人類,敍述者的思考無法在故事里躲藏。在人機合作過程中,人類能否及時辨認不合理之處,也是一項不小的挑戰。
參考資料:
1.《ListenHub 視頻繪本,把每個人的想象都變成視頻故事》,有機大橘子。2025.9
2.《3秒出標題,15秒出簡介,30秒出一整本少兒繪本|專訪ImageStory》,視智未來,2023.9
3. 《Can machines learn morality?The Delphi Experiment》, JIAN G L W,HWANG J D,BHAGAVATULA C,2022:2110.
本文來自微信公眾號「刺蝟公社」(ID:ciweigongshe),作者:白棉,編輯:園長,36氪經授權發佈。