三花AI 2024年11月22日
京东健康开源音频数字人头;电商行业福音,IC LoRA高效多场景精准出图;Gemini重夺竞技场榜首;Tülu3完全开放的大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本周AI领域亮点纷呈,阿里In-Context LoRA项目开放10个预训练模型,并被广泛应用于虚拟试穿、品牌设计等场景;京东健康开源音频驱动的数字人头项目JoyVASA,支持唇形同步和表情控制;Black Forest Labs发布FLUX Tools系列模型,官方支持控制模型,ComfyUI第一时间支持;Tülu 3大模型完全开放数据、评估代码和训练算法,表现优异;谷歌Gemini模型重夺竞技场榜首。这些进展展现了AI技术在图像生成、数字人、模型控制和开源大模型等领域的快速发展。

🚀 **阿里In-Context LoRA项目开放10个预训练模型,并被广泛应用于虚拟试穿、品牌设计等场景。** 该项目基于Flux,生成效果出色,在电商领域具有巨大潜力,例如Logo in Context工具可以将任何Logo融入到任何事物中。

🗣️ **京东健康开源音频驱动的数字人头项目JoyVASA,支持唇形同步和表情控制,甚至可以为动物生成数字头。** 该项目在数字人领域具有一定优势,为市场提供了新的选择。

🎨 **Black Forest Labs发布FLUX Tools系列模型,包括Fill、Depth & Canny等,并基于Flux dev的开源协议。** ComfyUI第一时间支持了这些模型,官方支持的生态建设,有利于模型的进一步发展。

🤖 **Tülu 3大模型完全开放数据、评估代码和训练算法,在12项基准测试中表现优异,甚至超越了部分闭源模型。** 官方目标是让任何人都能训练模型,开放权重和基础设施,展现了开源大模型的潜力。

🥇 **谷歌Gemini模型重夺竞技场榜首,在lmarena上超越了OpenAI最新发布的模型。** 这也体现了AI模型在不断迭代和竞争中发展。

原创 小茸茸 2024-11-22 09:34 重庆

阿里 In-Context LoRA:高效多场景精准出图;京东健康开源音频驱动的数字人头项目 JoyVASA;Black Forest Labs 发布 FLUX Tools:官方支持的控制模型;Tülu 3:完全开放的大模型

阿里 In-Context LoRA:高效多场景精准出图

In-Context LoRA[1] 是阿里最近非常火的一个项目。上次介绍时,模型还未开放,现在官方已经放出了 10 个预训练模型。社区围绕它开发了多种工作流,如虚拟试穿、品牌设计、对象迁移和角色扮演等。

IC LoRA 基于 Flux 这玩意生成的效果非常好,电商领域一定能打出一片天。

配图使用 Logo in Context[2] 制作,这也是利用了 IC LoRA。配合图生图技术,可以将任何 Logo 融入到任何事物中。

京东健康开源音频驱动的数字人头项目 JoyVASA

JoyVASA[3] 是京东健康开源的一个音频驱动的数字人头项目,它不仅支持唇形一致和表情控制,还能为动物生成数字头。这类技术在市场上非常多,有需求的读者可以在三花上搜索‘数字人’,不过真正落地的不多,JoyVASA 看起来是个不错的选择。

Black Forest Labs 发布 FLUX Tools:官方支持的控制模型

黑森林实验室(Black Forest Labs)发布了 FLUX Tools[4] 系列模型,包括:

Tülu 3:完全开放的大模型

Tülu 3[6] 70B & 8B 是一个完全开放数据、评估代码和训练算法的大模型。在 12 项基准测试中,其平均得分超越了许多同参数量开源模型,特别是 70B 模型,其表现甚至超越了 GPT4o-mini,直逼 claude 3.5 haiku。官方宣称,他们的目标是让任何人都能后训练模型,因此不仅开放了权重,还一并开放了整套基础设施。非常的酷

谷歌 Gemini 模型重夺竞技场榜首

谷歌 AiStudio[7] 上新了实验性的 gemini-exp-1121 模型,该模型在 lmarena[8] 上超越了昨天 OpenAI 发布的新 4O 模型,重新夺得了榜首。好家伙,回合制,OpenAI 第一的位置屁股还没坐热呢。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享、赞赏 六连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

In-Context LoRA 项目官网: https://sanhua.himrr.com/news/04420f27-bca7-430a-84be-146d0f89a26b

[2]

Logo in Context 工具官网: https://huggingface.co/spaces/multimodalart/logo-in-context

[3]

JoyVASA 项目官网: https://jdh-algo.github.io/JoyVASA/

[4]

FLUX Tools 系列模型: https://blackforestlabs.ai/flux-1-tools/

[5]

ComfyUI 发文: https://blog.comfy.org/day-1-support-for-flux-tools-in-comfyui/

[6]

Tülu 3 官方博客: https://allenai.org/blog/tulu-3

[7]

谷歌 AiStudio: https://aistudio.google.com

[8]

lmarena: https://lmarena.ai/


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 大模型 In-Context LoRA JoyVASA FLUX Tools
相关文章