新智元报道
新智元报道
一键拥有马斯克同款AI女友
ShellAgent的「工作室(Workshop)」有一种简洁的哲学之美,只有一个对话框。只需在聊天框输入「帮我制作一个二次元AI女友」,然后就可以转身下楼去买咖啡了。回来的时候就会发现,ShellAgent不仅准备了一个介绍角色的小卡片,而且还把可以交互的按钮准备好了。点一下,我们的「AI女友」就做好了。如果在使用过程中遇到了bug,也完全不用担心。直接点「Fix with ShellAgent」,就可以一键完成修复了。不愧是面向「小白」的智能体构建器,实在是贴心。最后,我们再点击一下右上角的「部署」,就可以和自己定制的「AI女友」互动啦!
赛博算命,老黄40岁加入佳境?
最近,黄仁勋穿着皮衣在北京的炎炎夏日之下接受采访,可以说火到出圈了。在现场,让人印象最深的回答之一便是,老黄表示自己已经财富自由25年了,不用为孩子和家人担忧,可以完全投入到自己的事业当中。那么,「脑洞」来了!我们是不是可以搞一个「赛博算命先生」,看看能不能算出来老黄的「财运」?很快,ShellAgent生成了一个生辰八字分析器——只需输入出生年月和地点,就能分析出这个人的运势、五行、事业、婚姻情感等等。根据ShellAgent自动生成的「信息收集表」,填入出生年月和出生地点就可以了。接下来,就到正戏了——输入老黄的出生年月日。从结果来看,这个「算命先生」似乎还可以,说老黄是40岁以后财运渐入佳境。比现实中稍晚了一些,但差不太多。既然是「赛博算命」,怎么能少了「看掌纹」这个环节。随着指令的输入,ShellAgent便自动开始为任务「构思应用名称」,并列出自己的工作顺序。在右侧,我们可以实时追踪它的任务清单和标记用户旅程的流程图,所有这些都能作为上下文,随时调整!Prompt:帮我打造一个看手相专家,只需输入手掌照片,就能测算我的运势依然是端到端的text2app,而且ShellAgent还提供了一个「User Journey」功能,可以通过该功能概览APP的创建过程。很快,一个看手相APP就构建完成。并且还可以二次要求,将生成内容转化为「长图」,Agent会再次启动,将新功能生成长图加入到APP中。最终我们就获得一张手相分析图。
电影经典名场面,看图即猜
一张图,猜出电影名字,ShellAgent也能一键完成搭建。只需要说一句「看图猜电影AI」,它便立即开始执行了,在构建过程中,会向你提前确认一些细节,包括图片类型、电影范围、交互方式等。不一会儿功夫,ShellAgent就完成了一款应用。并且,还有一个项目总结,涵盖了核心功能、应用特点,使用方式。
在部署前,可以先在右侧对话框中进行测试。比如,上传一张经典剧照,看它能否正确给出解答。不出所料,AI智能体一次性给出了正确答案——「穿普拉达的女王」。更令人惊喜的是,它还给出了电影上映年份、导演、主演名字,并且图中三位女演员的名字,以及电影场景中的角色一一给出描述。
另一个国产电影经典名场面,它瞬间解读出了紫霞仙子的意中人。
打工人待办助手,遇事不慌
对于打工人来说,每天要面对繁杂的事,常常应接不暇。这时,一个能智能规划日程、提醒重要事项的AI助理,就显得尤为重要。不如,就让ShellAgent创建一个「智能待办事项助手」。在创建之前,它会告知一些限制,以及可行的替代方案。同样,在执行任务之前,也会事先确认好核心需求。比如,要求是打造一个会话内待办助手,具备时间管理建议、任务分解建议等功能。同时还要告诉其,应用场景主要在「日常工作任务管理」,以及通过自然语言输入任务。在此过程中,ShellAgent主动调用了Claude组件,并可视化了用户交互流程。完整构建流程,如下图所示。接下来,只需要等待15-30分钟,智能待办事项应用助手就完成了。这时就可以直接开启测试,把需要待办任务,一一扔给AI。首先,添加一个「明天下午2点开会讨论项目方案」,它会根据要求,给出优先评级,下一步行动建议。随后,我们又添加了两项新任务,「傍晚6点去超市买一周的食材」、「晚上9点给朋友或家人打个电话,聊聊近况」。假设一天的任务全部添加完毕,就可以查看任务列表了。AI助手会贴心地把一天中所有的任务,根据时间、类别、预计用时等,全部规划完成。
若是完成了其中一项,直接告诉其任务编号,AI助手就帮我们打勾了。这套流程走下来,不得不夸ShellAgent生成的AI助手太强了,人手一个Agent梦想成真。从这些实测不难看出,完全对话式的(Talk-app)的App创作流程才是Vibe Coding的下一个形态。无需IDE、无需Coding、甚至无需测试和部署。就像OpenAI的Codex团队在接受采访中曾提到的,未来的编程就像是刷Tinder,遇到好的需求就「点赞」,遇到不好的就「滑掉」。ShellAgent带领我们率先进入Vibe Coding 2.0时代。
Vibe Coding进入2.0时代
现在,MyShell在X平台上有20多万粉丝,最新推出的Web版本主打的是Vibe Coding 2.0。未来通过自然语言不仅仅是和AI聊天这么简单。当大模型的能力不断提升,人类的「自然语言」几乎可以说是变成了一种「咒语」,无所不能。老黄在欧洲科技月就说未来的编程语言是「Human」。提出氛围编程的Karpathy在他的个人账号上始终置顶的一句话就是「英语(他的母语)是未来的编程语言」。自「氛围编程」被提出(Vibe Coding)之后,科技巨头们对于AI Coding这件事就持续加码。Cursor的百亿估值、Windsurf的狗血收购剧情,都在表明,让编程变得容易更容易确实是一门好生意。Cursor从零到百亿美金只用了不到3年,这三年就是Vibe Coding呼声最大的三年。Windsurf更是经历了管理层被连锅端,员工傻眼的,但又迅速被买断的狗血事件。除了商业,科技巨头纷纷宣布内部代码已经开始由AI生成,谷歌扬言目前50%的代码都是AI生成。对于编程本身来说,更成为了AI模型的试金石。不论是闭源ChatGPT、Gemini还是开源的DeepSeek、Qwen、Llama等模型,发布新模型的第一件事情就是找几个编程基准测试一下。这在过去很难想象。Vibe Coding已经成为AI时代一种全新的生产范式,一个月100美元的Claude Max、200美元的ChatGPT Pro还有马斯克300美元一个月的SuperGrok Heavy,都在证明氛围编程的潜力。氛围编程某种意义上是AI时代的创造力载体,就像过去我们的创造力是通过Tiktok、Instagram等短视频载体来表现。手机、摄像头和网络催生了繁荣社交媒体生态,现在AI时代来了,每个人都拥有了自创产品的能力,一个新时代仿佛在招手。但冷静下来会发现,目前Vibe Coding(暂且称为1.0时代)依然运行在Cursor等IDE上,距离让普通用户能接触到依然还差了部署和运维的步骤。这样一来,「编程能力」又回到了少数技术派手中。顶级程序员借用AI可以达到C罗的身价,而普通人却被Vibe Coding隔离到时代之外。只有真正的Talk-app范式才能达到AI平权,毕竟人人都会自然语言。如果能有一个地方,能打通「想法」——「产品」中间的所有步骤,就像AI聊天一样,说句话就能打造一个产品或者APP,那每个人都可以直接将自己的想法具象成可用的产品来分享交流。
AI编程终极钥匙:人类语言
其实提升开发效率,在AI出现以前就是一个很大的「议题」。比如各种前端框架、后端框架、低代码平台等。AI出现后,自动写代码带火了Cursor、Windsurf等IDE平台,Cursor更是创下了最快百亿美金估值公司的记录之一。MyShell的使命是将AI编程的故事再进一步。就像老黄和Karpathy所憧憬的那样,通过「人类的自然语言」直接生成APP。当AI的能力能够「吞噬」互联网那个时代的上下游节点,直接接管编码、测试、部署甚至运维。这就是新时代的TikTok和Instagram,人人都可以分享自己的产品。从表达自己,到创造世界。MyShell,就是那把钥匙。让每个人真正成为创作者的时代,已经到来。
文章原文