京东健康开源音频数字人头；电商行业福音，IC LoRA高效多场景精准出图；Gemini重夺竞技场榜首；Tülu3完全开放的大模型

原创小茸茸 2024-11-22 09:34 重庆

阿里 In-Context LoRA：高效多场景精准出图；京东健康开源音频驱动的数字人头项目 JoyVASA；Black Forest Labs 发布 FLUX Tools：官方支持的控制模型；Tülu 3：完全开放的大模型

阿里 In-Context LoRA：高效多场景精准出图

In-Context LoRA^[1] 是阿里最近非常火的一个项目。上次介绍时，模型还未开放，现在官方已经放出了 10 个预训练模型。社区围绕它开发了多种工作流，如虚拟试穿、品牌设计、对象迁移和角色扮演等。

IC LoRA 基于 Flux 这玩意生成的效果非常好，电商领域一定能打出一片天。

配图使用 Logo in Context^[2] 制作，这也是利用了 IC LoRA。配合图生图技术，可以将任何 Logo 融入到任何事物中。

京东健康开源音频驱动的数字人头项目 JoyVASA

JoyVASA^[3] 是京东健康开源的一个音频驱动的数字人头项目，它不仅支持唇形一致和表情控制，还能为动物生成数字头。这类技术在市场上非常多，有需求的读者可以在三花上搜索‘数字人’，不过真正落地的不多，JoyVASA 看起来是个不错的选择。

Black Forest Labs 发布 FLUX Tools：官方支持的控制模型

黑森林实验室（Black Forest Labs）发布了 FLUX Tools^[4] 系列模型，包括：

Fill 支持局部重绘和扩图

Depth & Canny 官方 Controlnet 模型

Redux 图像参考图生图这些模型均已开放下载，并基于 Flux dev 的开源协议。ComfyUI 发文^[5] 表示第一时间支持了这些模型，官方下场做生态，好日子来了。

Tülu 3：完全开放的大模型

Tülu 3^[6] 70B & 8B 是一个完全开放数据、评估代码和训练算法的大模型。在 12 项基准测试中，其平均得分超越了许多同参数量开源模型，特别是 70B 模型，其表现甚至超越了 GPT4o-mini，直逼 claude 3.5 haiku。官方宣称，他们的目标是让任何人都能后训练模型，因此不仅开放了权重，还一并开放了整套基础设施。非常的酷

谷歌 Gemini 模型重夺竞技场榜首

谷歌 AiStudio^[7] 上新了实验性的 gemini-exp-1121 模型，该模型在 lmarena^[8] 上超越了昨天 OpenAI 发布的新 4O 模型，重新夺得了榜首。好家伙，回合制，OpenAI 第一的位置屁股还没坐热呢。

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享、赞赏 六连警告，这对我真的很重要！

Reference

[1]

In-Context LoRA 项目官网: https://sanhua.himrr.com/news/04420f27-bca7-430a-84be-146d0f89a26b

[2]

Logo in Context 工具官网: https://huggingface.co/spaces/multimodalart/logo-in-context

[3]

JoyVASA 项目官网: https://jdh-algo.github.io/JoyVASA/

[4]

FLUX Tools 系列模型: https://blackforestlabs.ai/flux-1-tools/

[5]

ComfyUI 发文: https://blog.comfy.org/day-1-support-for-flux-tools-in-comfyui/

[6]

Tülu 3 官方博客: https://allenai.org/blog/tulu-3

[7]

谷歌 AiStudio: https://aistudio.google.com

[8]

lmarena: https://lmarena.ai/

阅读原文

跳转微信打开

阿里 In-Context LoRA：高效多场景精准出图

京东健康开源音频驱动的数字人头项目 JoyVASA

Black Forest Labs 发布 FLUX Tools：官方支持的控制模型

Tülu 3：完全开放的大模型

谷歌 Gemini 模型重夺竞技场榜首

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签