三花AI 2024年10月21日
开源 3D 数字人头框架;实时渲染 CS:GO 的扩散模型;表情包自由;阿里妈妈8 步快速生成图像;开源可商用 TTS 模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了多项AI领域的新成果,包括INTELLECT-1大模型训练启动、OpenAI的相关产品、多种开源模型及框架等,涵盖了模型训练、搜索引擎设置、游戏模拟、头像框架、多智能体框架、TTS模型、LoRA等方面的内容。

💻INTELLECT-1是首个去中心化10B大模型,训练已正式启动,可在官网查看进度并贡献算力,目前训练进度达2.08%,samsja的算力贡献超过Hugging Face。

🔍OpenAI的SearchGPT可设为默认搜索引擎,部分美国用户可通过URL地址直达搜索结果页面并触发search功能,L站的oaifree也支持。

🎮diamond是专为模拟CS:GO设计的扩散世界模型,代码和数据集开源,在RTX 3090上能达10 fps运行速度,falAI还搭建了在线试玩网站。

👨‍🦲GAGAvatar是首个通用化的3D高斯头像框架,能将单张图片转为3D模型,支持从参考视频克隆表情和头部动作,代码和数据集开源。

🐝OpenAI开源的swarm是轻量级多智能体框架,用于实验性探索和教育目的,写法比AutoGen简单,作者会持续跟进后续动态。

🎙F5-TTS是开源可商用TTS模型,支持中英文语音生成和克隆,中文效果和多音字识别稳定性有待提升,但速度不错。

😜JujoHotaru LoRA是控制人物表情的LoRA,支持SDXL,包括多种表情和LoRA,可实现表情包自由。

📷阿里妈妈推出FLUX.1-Turbo-Alpha,是支持8步出图的LoRA,基于FLUX.1-dev模型训练,能在牺牲少许质量的情况下大幅提高速度,适配相关生态。

原创 小茸茸 2024-10-14 09:45 重庆

INTELLECT-1首个去中心化 10B 大模型训练正式启动;OpenAI SearchGPT 设置为默认搜索引擎; OpenAI 开源轻量级多智能体框架 swarm;F5-TTS;JujoHotaru LoRA:实现表情包自由

diamond:实时渲染 CS:GO 的扩散模型

diamond[1] 是一款专为模拟 CS:GO(反恐精英:全球攻势)设计的扩散世界模型,允许玩家通过键盘和鼠标操作角色。该模型代码和数据集完全开源,在 RTX 3090 上能够达到 10 fps 的运行速度,成为继 Doom 之后的第二款实时游戏生成模型。falAI 还为此专门搭建了一个在线试玩网站[2],真是太酷了!

INTELLECT-1:首个去中心化 10B 大模型训练正式启动

有史以来第一个去中心化训练的 10B 模型现已正式启动!你可以在官方网站[3]查看训练进度,并贡献你的算力。目前,训练进度已经达到了 2.08%,其中算力提供最多的是 samsja,甚至超过了 Hugging Face 的贡献。

将 OpenAI SearchGPT 设置为默认搜索引擎

OpenAI 的 SearchGPT 虽然只对部分美国用户推出了UI,但是可以直接通过 URL 地址来直达搜索结果页面,并 100% 触发 search 功能,快试试将你的浏览器默认搜索引擎替换为:https://chatgpt.com/?hints=search&q=%s 吧

演示视频来自大佬 btibor91。我测试了下非常好用,L 站的 oaifree 也是支持的,佬友们可以尝试下:https://shared.oaifree.com/?hints=search&temporary-chat=true&q=%s

GAGAvatar:开源 3D 数字人头框架

GAGAvatar[4] 是首个能够通用化的 3D 高斯头像框架,它能够将单张图片转换为 3D 模型,并支持从参考视频中克隆表情和头部动作。代码和数据集完全开源!

OpenAI 开源轻量级多智能体框架 swarm

OpenAI 最近悄悄开源了一个名为 swarm[5] 的多智能体框架,这个框架看起来相当轻量。不过,官方明确表示,这个框架仅用于实验性探索和教育目的,不建议在生产环境中使用。从写法上看,swarm 比 AutoGen 要简单得多。关注我,我会为你持续跟进后续动态!

F5-TTS 开源可商用 TTS 模型

F5-TTS[6] 是最新开源可商用 TTS 模型,支持中英文语音生成和克隆。官方提供了在线演示[7],虽然中文效果和多音字识别的稳定性有待提升,但速度表现不错,且贵在可商用。

JujoHotaru LoRA:实现表情包自由

JujoHotaru LoRA[8] 是一系列专门用于控制人物表情的 LoRA,现已支持 SDXL。模型包括闭眼、Wink、没睡醒、屑、傻笑、惊讶、眼角调整、漫画眼、滑稽眼、各种表情包眼、各种嘴型/口型等。此外,还提供了夜景、2D 转 2.5D、高光等 LoRA。非常的强呀,这下表情包自由了!远不止我介绍的那些,官方有大量的演示,有兴趣的不要错过!

阿里妈妈推出 FLUX.1-Turbo-Alpha:8 步快速生成图像

FLUX.1-Turbo-Alpha[9] 是阿里妈妈推出的一款支持 8 步出图的 LoRA,基于 FLUX.1-dev 模型进行训练。其最大特点是在略微牺牲质量的情况下大幅提高速度,同时还适配 Flux-dev 的局部重绘、ControlNet 模型等相关生态。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

diamond 模型代码和数据集: https://github.com/eloialonso/diamond/tree/csgo

[2]

falAI csgo 在线演示: https://fal.ai/demos/csgo

[3]

Prime Intellect AI 官网: https://app.primeintellect.ai/intelligence

[4]

GAGAvatar 项目官网: https://xg-chu.site/project_gagavatar/

[5]

OpenAI 开源的多智能体框架: https://github.com/openai/swarm

[6]

F5-TTS 官网: https://swivid.github.io/F5-TTS/

[7]

F5-TTS 在线演示: https://huggingface.co/spaces/mrfakename/E2-F5-TTS

[8]

JujoHotaru LoRA 官方文档: https://huggingface.co/JujoHotaru/lora/blob/main/sdxl/README.md

[9]

FLUX.1-Turbo-Alpha 模型页面: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

INTELLECT-1 OpenAI diamond GAGAvatar swarm
相关文章