掘金 人工智能 04月30日 10:23
老板:GPU这么贵,你天天吃泡面的,怎么玩的起自建AI写真?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文讲述了作者如何利用现有AI技术,特别是InstantID和PuLID模型,低成本自建AI写真服务。作者通过replicate平台调用API,避免了昂贵的GPU和复杂的环境配置。通过自建界面,用户上传照片并选择风格,即可快速生成AI写真。这种方法不仅降低了成本,还实现了商业化的标准化和简单化,为AI应用提供了新的思路。

💡 **AI写真新思路**:传统AI写真依赖提示词和LORA训练,操作繁琐且成本高。作者另辟蹊径,利用InstantID等新模型,简化流程,降低门槛。

🛠️ **Replicate平台妙用**:Replicate平台提供大量预部署AI模型,通过API调用,无需本地部署,按需付费,极大降低了使用成本和技术门槛。

🎨 **风格盲盒设计**:作者自建界面,提供风格图片盲盒,用户上传照片后,点击风格图即可生成类似写真,无需编写提示词,提升用户体验。

🚀 **双模型对比**:InstantID效果好但耗时,PuLID速度快但效果稍逊。作者根据需求选择模型,或提供双模型选择,满足不同用户需求。

老板:GPU这么贵,你天天吃泡面的,怎么玩的起自建AI写真?

我:老板,吃泡面只是我的爱好,欣赏美女是我的另一个爱好。

老板:别说了,仓库里还有一台机皇,拿去当你的写真服务器,算是我的一点心意。

我:好的,谢谢老板,顺便帮我充个一年的花生壳,我做内网穿透,让它早日上线。

老板:准。

好了,年初的时候,想找个赚钱的思路,ai赛道什么可以做的?

问了一下kimi,得到以下答案:

以下是一些适合普通人和程序员利用AI开发应用赚钱的项目和方向:

内容创作类

    AI辅助写作:使用ChatGPT、文心一言等AI写作工具,创作自媒体文章、电子书、广告文案等内容。通过在百家号、微信公众号等平台发布文章获取广告收入,或者将电子书上传到Amazon KDP等平台销售。AI绘画与设计:掌握Midjourney、Stable Diffusion等AI绘画工具,创作壁纸、头像、表情包、插画等作品,通过小红书、抖音、闲鱼等平台展示和销售。AI视频创作:利用Runway、Pika等AI视频生成和编辑工具,制作热门或垂直领域的视频内容,发布到抖音、B站、YouTube等平台,通过流量变现。

技术开发类

    开发AI工具/应用(To C市场) :程序员可以开发自动生成PPT、简历优化、代码补全插件、AI写作助手、AI音乐生成等工具,通过订阅制、按次收费或平台分润的方式盈利。提供AI技术服务(To B市场) :为企业提供定制模型开发、数据清洗与标注、AI运维服务等,通过接单平台(如程序员客栈、猪八戒网、Upwork、Fiverr)接项目,按项目报价或按小时计费。

其他方向

    AI数字人直播:通过D-ID或HeyGen生成数字人形象,用GPT-4编写直播话术,利用Azure Cognitive Services实现语音合成,进行数字人直播带货或企业IP代运营,通过带货分佣或收取月费盈利。AI咨询:结合自己的专业知识和AI工具,提供企业管理咨询、升学咨询、职业规划咨询、心理咨询等服务。AI套壳服务:选择特定的AI功能,开发或购买套壳系统,添加自有品牌和特色功能,加入付费机制后部署上线并推广,通过订阅或付费使用的方式盈利。

在选择项目时,需要根据自己的技能、兴趣和市场需求进行综合考虑,并且要注重持续学习和优化,以提高项目的竞争力和盈利能力。

上面的思路还是可以的,说说我的实践:

我用python做过ai语音播报软件,用来做直播,自己训练的语音模型,充分利用了GPU的性能。为公司节省了可能投入的几千上万的软件成本。

除此之外,我还对ai写真感兴趣。

调研了一下,stable diffusion ,midjourney 这些都能生成ai美女图片,一般的写真方案就是,先用prompt 提示词生成自己想要的美女或帅哥图片,然后用替换头像的软件或者插件把客人的头像替换上去,这个就像小时候路边的照相馆,用ps替小朋友做艺术写真。十多年了,技术变了,但生意的思路还是没变。

如果用 stable diffusion 的话,虽然是免费的,但需要自己安装,并且需要电脑有gpu算力,不然就是需要租用算力服务器,比如 autoDL

一小时就是一包泡面的价格,不是很贵,但长期下去,我可能连泡面都吃不起了。(不是

如果用midjourney,只需要买套餐,一个月70块左右还是能做出一两百张图片的,需要魔法,还需要再买一个机器人插件 InsightFaceSwap才能换脸,试了一下效果并不是很好。

对了,stable diffusion 用来写真的通常做法是这样的,我提一下: 就是训练LORA,给它喂5张以上的你的不同风格的照片,然后它需要训练好几分钟生成一个你的专属模型,然后你给它你想要的风格提示词,就可以生产你的艺术写真了。

这个做法还挺麻烦的,有一个叫XX相机的用的就是这个方法,我觉得都不是我想要的,那上面的思路是不是都不行了?有没有更直接简单的方法?毕竟我要商业化也要标准化,简单化和低成本化。

也不是,后来多亏了一些开发团队开发出了一些新模型,比如我现在要说到的 InstantID,它是stable diffusion 的一个模型插件,由中国的小红书团队开发的,

源码地址在这里:github.com/instantX-re…

图片是对现有的所有模型生成的同一个头像的风格对比,最后一列就是instantID的效果。

如果想体验但又不想自己搭建程序,可以使用huggingface(抱抱脸),或者replicate,这两个上面都有部署:

huggingface地址:huggingface.co/spaces/Inst…

replicate地址:replicate.com/zsxkib/inst…

友情提示:以上链接里的内容都是英文的,可以自行用谷歌浏览器翻译。好好的玩一下,还是值得的,因为下面我就要开挂了:

什么?什么都没讲清楚,就要开挂了?!

是的,我现在给你看到的这个 replicate 是一个好东西,让我们看看它能做什么:

Replicate由一支专注于AI基础设施优化的技术团队打造,致力于简化模型开发流程。该平台通过统一接口支持文本、图像、语音、视频等多种模态的AI模型部署,覆盖从实验到生产落地的全生命周期。无论是初创企业还是大型研发团队,均可通过Replicate快速实现技术验证与商业化应用。

让我一句话说明一下:使用replicate 可以通过CLI和API封装复杂环境配置,自动处理依赖项安装,实现“一行代码调用模型”。

重点在这里:“一行代码调用模型”。 这个网站上面有成千上万个模型,你不需要自己安装部署模型,官方已经部署安装好了,你只要会调用api ,就可以使用这些模型,而且是按需计费,使用多少付费多少,不用就不需要钱。

作为程序员的优势,我们的路子就一下子宽了,这就好玩了,原本我们需要通过一个页面,传我们的照片上去,并且在页面的输入框里写上prompt提示词来生成我们想要的目标写真图,现在我们可以自己调用api,批量生成写真。

有没有更方便的办法?不用写提示词,我上传图片,然后点点点,点一个参考风格图片,就能生成和它一样的风格?当然是可以的,这个就是我想实现的方法。如果你还是没有反应过来,我讲一下我的做法:

我写一个界面,然后在上面提供风格图片,每个风格图片都是自己试出来的效果,在数据库里填写了这张图片的prompt,这样我加个功能,上传一张原图,然后随便点击一张风格图,将这张图和promopt提示词一起发送到replicate上的instantID模型服务器,这样就能直接生成和这个风格图类似的图片了。

是不是 思路很棒也很简单,我给你看一下我最后实现出来的效果:

这些风格图片都是我从网上收集来的,提示词是我自己加在数据库里的,这样我上传一张照片,点击一张风格盲盒,就能生成和它类似的写真图片了。是不是很好用?

我用了两个模型,这个是instantID,生成的效果比较好,但是时间长,经常会遇到服务器冷启动:

这个模型是PuLID , 也是国产的,字节跳动的作品, replicate地址在: replicate.com/bytedance/p…这个可以十几秒同时生成4-8张写真,效果还可以,初次使用可以选择这个模型。

这个是原图:

是不是还是有点像的?

好了,我晚饭的泡面还没煮,今天就先抛砖引玉,更多细节如果有人想了解的话,我有空和你们交流一下,可以联系我laplacemaker。毕竟码字还是挺累的,我又不善于分享。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI写真 InstantID Replicate 低成本 风格盲盒
相关文章