原创 小茸茸 2024-09-29 09:17 重庆
阿里 AI 视频换人技术开源;filter_nude:NSFW 自动打码LoRA;voice2code语音实时生成代码;AI电影大赛冠军《RōHKI》首播;开源Gradio 表情编辑器;Runway发布Gen-3 Alpha Turbo更新
阿里开源 MIMO:AI 视频换人技术
前几天我们介绍过 MIMO[1],这是一种专用于视频人物替换与动画生成的技术。群里大家都吐槽阿里期货开源,这不,别骂了,代码来了哈哈哈[2],不过暂时还是 WIP,还得等等。
filter_nude:NSFW 自动打码 LoRA
直接删除 NSFW 内容可能会降低模型的质量,而这个 LoRA[3] 能在几乎不影响出图效果的情况下,对 NSFW 下的二次元妹子自动打码。作者特别指出,对 SWF 和男性角色几乎没有影响(南桐落泪),但遗憾的是,这个 LoRA 目前仅适用于 SDXL-Anime 和 Animagine3 系列模型。
voice2code:语音实时生成代码
voice2code[4],由 @AK 大佬开源的小工具,基于 llama-3.2-3b-voice 技术,能够实时将语音转换为代码。GitHub 早前推出的 Copilot Voice[5] 与 VSCode 集成,同样支持语音生成代码,值得一试。老罗又一次走在前沿 “安静,吵到我用 TNT 了.jpg”
AI 电影大赛冠军《RōHKI》首播第一集
Project Odyssey 主办的 AI 电影大赛一等奖作品《RōHKI》(熔炉)于 10 日发布了 12 分钟的第一集《Intersection[6]》(十字路口)。过去这么久我才发现,热度是真的低,不评价了,大家看视频吧。
开源 Gradio 表情编辑器
ComfyUI-AdvancedLivePortrait[7],一款实时数字人脸表情编辑器。现在,有一个类似的项目,基于 Gradio 并部署在 HF 上。不过,实际体验效果一般,使用时记得 Duplicate Space,否则速度会非常慢。你可以在这里[8]了解更多。
Runway 发布 Gen-3 Alpha Turbo 更新:支持竖屏视频生成
Runway 官方[9]宣布,Gen-3 Alpha Turbo 迎来重大更新,现已支持生成竖屏视频。此次更新不仅提升了生成速度,还增强了控制性、表现力和保真度。不过,演示视频的效果有点掉 San 值,观看时请自行斟酌。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
MIMO技术介绍: https://sanhua.himrr.com/news/ac271c34-1e93-493f-a793-03b1f6f0aa0e
[2]MIMO代码: https://github.com/menyifang/MIMO
[3]filter_nude: https://huggingface.co/bdsqlsz/filter_nude
[4]voice2code 项目页面: https://huggingface.co/spaces/akhaliq/llama-3.2-3b-voice
[5]Copilot Voice 项目页面: https://githubnext.com/projects/copilot-voice/
[6]Intersection 4K 视频: https://www.youtube.com/watch?v=QLV0sKfxk9s
[7]ComfyUI-AdvancedLivePortrait 项目详情: https://sanhua.himrr.com/news/f4ad6578-958f-4212-bf18-ced88d9bcec2
[8]Expression Editor 项目详情: https://huggingface.co/spaces/fffiloni/expression-editor
[9]Runway 官方公告: https://x.com/runwayml/status/1839726528965304566