原创 小茸茸 2025-01-13 09:35 重庆
xAI发布Grok iOS支持图像生成与实时数据访问;FitDiT开源虚拟试穿模型;快手KlingAPP安卓版即将推出;阿里通义Qwen Chat支持全系列 Qwen 模型;Adobe FaceLift:单张照片生成高保真 3D 头部模型
xAI 发布 Grok iOS 应用,支持图像生成与实时数据访问
Grok iOS App[1] 现已上线美区 App Store,支持生成图像和对话。用户需要使用 X 账号登录,以实时访问 X 和 Web 数据。
系统版本要求较高,需更新至 iOS 17 才能安装,如果你在用巨魔啥的就无缘了。安卓版本即将推出。
FitDiT:开源 AI 虚拟试穿模型,支持上衣、下衣或整套更换
FitDiT[2] 是一个开源的 AI 虚拟试穿模型,其最大的特色是支持用户选择更换上衣、下衣或整套服装。佬友们可以在线试用一下。
不过我用下来感觉整体效果不如之前介绍的 Leffa[3]。Leffa 前几天还更新了一波,在 A100 上生成只需 6 秒,速度相当快。
快手 Kling APP 登陆美区 App Store,安卓版即将推出
Kling APP[4] 现已正式上架美区 App Store,安卓版本也即将上线。
简单体验了一下,和 Web 版本差不多,支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。
阿里通义团队推出 Qwen Chat:支持全系列 Qwen 模型
Qwen Chat[5] 是阿里通义团队近日上线的一款基于开源的 Open WebUI[6] 的 WebUI,支持 Qwen 全系列模型。
模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型,以及 Qwen2.5-Coder-32B-Instruct 编程模型。
Qwen Chat 支持同时对比多个模型,还即将推出网络搜索、图像生成和语音模式,值得期待。
Adobe FaceLift:单张照片生成高保真 3D 头部模型
FaceLift[7] 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。
该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。
此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。
从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
Grok iOS App 美区 App Store 页面: https://apps.apple.com/us/app/grok/id6670324846
[2]FitDiT 在线试用: https://huggingface.co/spaces/BoyuanJiang/FitDiT
[3]Leffa 更新信息: https://sanhua.himrr.com/news/9c5dc8e6-16f8-47ae-af44-ee125b57229f
[4]Kling iOS App: https://apps.apple.com/us/app/klingai/id6738049229
[5]Qwen Chat 官网: https://chat.qwenlm.ai/
[6]Open WebUI 官网: https://openwebui.com/
[7]FaceLift 技术官网: https://weijielyu.github.io/FaceLift