IT之家 03月22日 15:03
AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Grok迅速推出图片编辑功能,允许用户通过文字描述直接修改图片,如更换服装、发色等。此举紧随Gemini的图片编辑热潮,反映出AI巨头的激烈竞争。文章指出,大模型的发展可能导致工作方式从复杂操作向简单交互转变,传统软件或将受到冲击。Grok的图片编辑功能目前仍处于灰度测试阶段,但用户反馈效果良好,预示着AI在图片编辑领域的巨大潜力。

📸Grok上线图片编辑功能,用户可通过文字描述修改图片,如更换证件照服装、改变发色等,手机App也同步上线。

🔥Grok图片编辑功能效果出色,用户可选择不同风格,例如证件照西服的多种款式,且测试用户反馈良好,展现了AI编辑的潜力。

💡Grok此举可能受到Google Gemini 2.0的启发,后者凭借文本描述实现图片编辑的功能引发关注,预示着大模型在图片编辑领域的激烈竞争。

🔄文章指出,AI发展或将带来工作方式的范式转移,从复杂的软件操作转向简单的交互,AI大模型将降低图片编辑的技术门槛。

⚠️尽管AI图片编辑效果仍在发展中,专业图片编辑仍需专业软件,但SOTA模型的内卷预示着未来AI在图片编辑领域的巨大潜力。

Grok 连夜上线图片编辑功能,继 Gemini 引爆图片编辑热潮后,动动嘴就能实现「证件照换西装」、「黑发变金发」等专业级 P 图效果。随着 AI 巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。

Grok 连夜上线图片编辑功能。

昨晚,Grok 上线图片编辑功能,可以通过文字描述直接修改图片。

比如你可以上传一张个人证件照,「动动嘴」让 Grok 给你 PS 一套全新的西服。

看起来效果非常不错,Grok 还「体贴地」给你设计了四种不同风格,比如领带「带花纹」和「不带花纹」。

不过该功能目前应该还是在灰度测试中(作为 Premium 氪金用户的 Grok 主页暂时还没有编辑按钮)。

Grok 手机 App 同步上线

Grok 也同步上线了 X 的手机 APP,你也可以在手机上体验图片编辑功能。

比如上传一张照片,让图片中人物的「黑发」变成「金发」。

不过作为手机内部的 Grok 功能,目前同样是在灰度测试中。

由于 Grok 灰色测试,目前全网还没有太多讨论。

不过从一些博主的测试作品来看,Grok 应该是对自己的效果很有信心。

比如这位有 6 万粉丝的 Borriss 博主,他的头像是一件「黑色高领毛衣」。

但是经过 Grok 的 P 图后,换成了一套「西服」。

「黑毛衣秒变西服」,AI 编辑的能力目前看起来效果并不赖。

其他陆续有用户放出了自己使用 Grok 编辑图片的效果,不过这次 Grok 犯了一个错误,把用户的脸也给换了。

比如,可以将图片风格变成 Egon Shiele 的画作风格。

或者是给马斯克加一顶帽子。

大模型「内卷」,PS 受伤

Grok 这次「连夜」上传图片编辑功能,大概率是被 Google 的 Gemini2.0 火出圈的「动动嘴」PS 功能给刺激到了。

Google 发布 Gemini-2.0-flash 的 Experimantal 版本靠着简单的文本描述就能「P 图」的能力着实火了一把。

比如将两张照片 P 在一起还不违和,并且可以添加人物动作。

或者,将白色风格的裙子换成红色,还能给人物打个领带。

从 Gemin2.0 到 Grok 的图片编辑,能看出目前 SOTA 模型的「内卷」依然还在进行。

大模型也在「抢占」用户心智。

以后人们谈起 P 图,第一个想到也许不是 Photoshop 这种传统的图片编辑软件,而是 AI 赋能各种大模型功能。

从 P 图这件事情可以窥见一些苗头,AI 的发展很可能会带来一个很大的「范式转移」。

未来的很多工作会从「复杂操作」变成「简单交互」。

比如在图片编辑领域,Gemini 和 Grok 等大模型将持续降低图片编辑的技术门槛。

从原来需要专业软件、复杂步骤,到只需一句自然语言指令即可实现高质量图片编辑。

当然在目前的大模型 P 图效果依然停留在「可玩」的层面,专业的图片编辑还需要专业的 UI 工程师使用特定的软件才能完成。

不过 SOTA 模型的内卷依然没有结束。

正如 Alvaro Cintas 所说,为什么 OpenAI 还没有发布原生图像生成和编辑功能。

也许快了,说不定哪天 ChatGPT 就放出编辑原生图片。

参考资料:

本文来自微信公众号:新智元(ID:AI_era)

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok 图片编辑 AI 大模型 Gemini
相关文章