比GPT-4o更早一年推出“吉卜力风”！这款国内AI产品还能让“宫崎骏宇宙”动起来！

原创冰拿铁 2025-04-02 18:45 北京

“吉卜力画风”，从一张图走向一个故事。

作者｜冰拿铁

编辑｜星奈

媒体｜AI大模型工场

起猛了，一觉醒来，周围变宫崎骏宇宙了，微信好友列表“人均吉卜力画风”：

这要追溯到前几天，OpenAI 更新了GPT-4o模型，推出原生图像功能，能够更精准地根据文字指令生成图片，只需要输入“把图片中的人物变成吉卜力工作室角色”，即可将照片一键变成与吉卜力工作室创作的《千与千寻》《龙猫》等动画风格类似的图片。

功能一经推出，就引发全网社交媒体“AI 吉卜力风”潮流，就连 OpenAI CEO Sam Altman 也一度将自己的 X 平台头像改为“吉卜力版本”，GPT-4o 也在LMSYS 排行榜上升至第二。在一条爆火的帖子中，网友Grant Slatton称，赶紧把你和老婆的合照转化成吉卜力风格然后发给她，绝对是极大的加分项~

然而，就在我感叹AI发展速度如此之快、准备自己也生成个宫崎骏风头像时，隔壁工位的设计岗同事却相当淡定：“有什么值得大惊小怪的，我一年前就能用AI生成宫崎骏画风的图了，还能做个画本！还是有声的视频！”

？？？

被一番科普后，我才发现，这个“闷声开大”的产品，竟然是我日常写稿、找素材时的老工作搭子：百度文库！

事实上，早在2024年4月，百度文库APP就悄悄上线了“AI有声画本”功能，输入一个主题就能生成画本，能选择将近10种画风，其中就包括最近大火的宫崎骏画风。不止于此，在百度文库APP，还能自由选择角色或者上传照片定义角色、选择配音等，不仅能实现文生图，还能将多图变成画本视频，成为图文声并茂的“睡前故事”！

那么，最终效果究竟如何？我们一起来试试！

实测百度文库AI有声画本：

图文声并茂，一站式端到端交付！

只有模糊的灵感，但由于词汇量匮乏写不出完整的脚本？没关系，点开AI有声画本，输入“帮我写一个龙猫式森林探险的故事大纲”，点击左下角DeepSeek R1-满血版，百度文库即可调用DeepSeek，交付出起承转合完整的脚本大纲。

其中不乏优美的意境和生动的细节，如“清理时毒藤蔓发疯似的缠过来，小龙猪急得把草莓酱全泼了出去”“藤蔓碰到甜味居然缩回去了，原来它们最怕天然发酵的味道”“月亮泉恢复清澈后，整片森林开出了会唱歌的夜光花”……

可见，百度文库将DeepSeek-R1模型的深度思考能力和自身强大的多模态能力进行了对齐，实现了文本-图像-音视频的深度同频共振，好比文笔优美的写手和功底深厚的画手双剑合璧。

确认后，则进入制作画本环节，选择宫崎骏画风，一个《龙猫森林奇遇记》的画本就生成了：

再来一个“人类与森林精灵共同修复被污染的魔法之湖”故事。值得一提的是，如果对画本中的单张图片不满意，也可以用AI进行改图，为二创、精调留足了空间。

再加上，百度文库还有猪猪侠等大量版权角色，所以宝爸宝妈还可以脑洞大开，来个跨文化融合，让猪猪侠一键穿越，在宫崎骏宇宙里写作业：

除了最近大火的宫崎骏画风外，百度文库还有画风可供选择。比如，选择毛绒画风，一键生成萌化老母亲的小兔子：

再比如，生成3D动画效果的《桃花源记》，寓教于乐，让看不进去课本的娃爱上语文：

在生动的画本故事之外，可以清晰地看到，百度文库AI有声画本在多场景处理、人物一致性、故事完整性等方面都已经达到遥遥领先，画风也十分成熟多变。

不止于此，相较GPT-4o，百度文库的独家优势是一站式、端到端的交付：

GPT-4o的文生图功能确实惊艳，能将用户上传的照片转化为漫画、动画风格，甚至生成主题彩漫。但这种能力仍停留在单点优化层面。生成单张图片后，用户若想创作完整故事画本，仍需手动串联图片、添加配音、制作视频，在多个工具间反复切换。

而在百度文库上，则实现了一站式、端到端闭环，还实现了DeepSeek深度思考与AI生图、生视频的多模态能力的梦幻联动，解决了创作中多工具切换导致的内容割裂问题。这种“一站式交付”的能力，恰恰是当前大多数AI软件的生态短板。

这也让行业感慨，未来的内容竞争，不再是单一模态的较量，而是全链路生态的协同进化。

在欣赏这么多画本之余，也不禁让我们思考，这样的AI有声画本，到底如何最大化的为我所用？

家庭教育、休闲娱乐、兼职赚钱……

AI有声画本有望掀起全民创作浪潮

首先，就是家校共育背景下的家庭教育场景，通过AI，即使完全没有绘画基础的父母，也可以一句话、几分钟就创作出图文并茂、人声朗读的视频画本，帮助父母在家庭中低门槛地实现对孩子的常识教育，在其乐融融的亲子互动中，开启有爱的共创之旅。

当下，中国小孩每年的人均绘本阅读量只有10本，而欧美国家小孩为50本左右。而百度文库降低了绘本的阅读门槛与成本，有望让这一差距缩小甚至追平。

在学校教育领域，智能画本可以作为教学工具，帮助教师创建互动教学内容，提高学生的学习兴趣和效果。例如，在语文、历史课上，教师可以通过智能画本展示历史事件和人物，让学生更加直观地理解历史背景和文化内涵。

而对于打工人、学生党而言，百度文库还为更多“斜杠青年”提供了机会，用户也能通过作品发布、分享获取收益、兼职赚钱；自媒体博主可以使用智能画本快速生成视频画本，将故事和想法转化为视觉输出，丰富创作内容，提高创作效率，例如，一位美食博主可以利用智能画本生成一道菜品的制作过程和成品展示，这将极大地降低内容创作的门槛，吸引更多跨界“外行”涌入自媒体行业。

在休闲娱乐领域，用户可以像此次出圈的“吉卜力画风”事件所展现的一样，一键生成自己的专属虚拟形象，AI结合面部识别与风格迁移技术，创造出既保留个人特征又充满未来感的“独家Q版形象”。这种个性化生产模式正在改变内容消费逻辑，用户从被动接受者转变为主动创造者。正如前段时间网上有个很火的议题“休闲时，输出型爱好永远比消费型输入爱好让人充实”，与AI共创无疑就是一个有趣的“输出型爱好”。

而对专业作者来说，智能画本还可以为艺术家提供创作灵感。艺术家可以用智能画本尝试不同的艺术风格和构图方式，探索新的创作可能性……

再放眼产业，AI绘图同样有望在未来大面积商业化，降本增效，驱动产业从“劳动密集型”转向“创意主导型”转型，缩短美术风格探索周期。

北京百纳千成影视股份有限公司首席内容官张苗曾说，“AI技术正加速在动画工业渗透，例如，AI辅助的群集动画生成效率有望提升50%以上，布料解算等复杂工序可能从数周压缩至数天。这种技术演进将重构动画电影的成本曲线。”

而想要从中脱颖而出、占位未来蓝海，必须提前布局。放眼绘画行业，这在百度文库等头号玩家身上体现得很明显：除了领先行业推出AI有声画本等功能外，早在去年4月，百度文库同步推出了智能漫画功能，并宣布与玄机科技达成战略合作，在跨模态 AI 技术、内容及 IP 共创等方面展开深入探索，打造更多基于 AI 技术的新国漫 IP。

可以预见，在百度文库技术不断打磨、提升下，AI绘图有望进一步走入千家万户，让AI普惠具象化。

尾声

Edelman公司全球技术负责人贾斯汀·威斯科特曾在文章中写道，当下大多数大模型就像是有无限工具的瑞士军刀——让人兴奋但不知所措。它对大多数人来说太广泛、太抽象、太难以接近。一个空白的聊天框不是产品，而是作业。

诚如所言，当下，这一比喻深刻揭示了大模型应用落地的主要矛盾，即就是功能丰富性与普通用户体验割裂性之间的矛盾：大模型虽具备文本生成、逻辑推理、多语言处理等综合能力，但普通用户面对空白输入框时，需将模糊需求转化为精确指令，如同学生需自行拆解题干隐含条件，还需要多个工具中来回横跳，最终才能完成属于自己的AI作品。

而真正好用的AI产品，则应该足够具体、应用场景足够丰富，且能够最大限度激发灵感、辅助创作，并让每个灵感都能找到生长的土壤。此次GPT-4o以吉卜力画风出圈背后，就是技术普惠与用户需求的共振结果，其价值不仅在于降本增效，更在于激活了人类创意的无限可能，让全民用起、玩起来。

百度文库则更进一步，把创作门槛降至一句话，让大多数人用得上、会用且爱用，趣味性和实用性皆拉满。

“一句话生成画本”魔法像是给用户递上一支智能画笔，让每个人都能在画布上挥洒想象——从诗人将朦胧意象化为宫崎骏宇宙，到教师用猪猪侠讲活课本故事，再到老人生成画本“追忆似水年华”，孩童带着对世界的温柔与好奇、用稚嫩却鲜活的语言构建童话世界……无一不让外界看到，AI正在成为人类思维的延伸器，专业创作与大众表达在数字世界中共生共舞、互相成就。

这种转变的更深层意义，在于它打破了“AI技术不接地气”的刻板印象。未来的创作图景，将是全民智慧与AI的水乳交融，人类负责保持对世界的惊奇与探索欲，AI则化身成为最懂我们的创作伙伴，在数字与现实的交界处，共同培育出超越想象的灵感之花。这或许就是AI最动人的承诺：不断完成从工具理性到人文温度的跃迁，让每个创意火花都能找到燃烧的舞台，让每个平凡日常的缝隙，都能悄悄开出小花、诞生非凡的创造。

AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」，覆盖超1000位AIGC圈，百度大模型业务负责人，京东大模型业务负责人，腾讯大模型业务人，阿里云大模型技术负责人，科大讯飞大模型公关，商汤大模型业务，阅文大模型公关，360大模型公关负责人都在群里啦，欢迎大模型业务负责人加入。请加微信fqq2000nian，注明真实身份。