掘金 人工智能 前天 12:18
OmniConsistency:GPT-4O 级的人物风格迁移模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期涌现出多款引人注目的AI模型和工具,涵盖性能提升、风格迁移、数字人生成以及跨平台APP开发等多个领域。DeepSeek R1模型在迭代升级后,性能已能与o3模型媲美;OmniConsistency模型在人物风格迁移方面表现出色,甚至优于GPT-4O;腾讯开源了HunyuanVideo-Avatar,仅需音频和图片即可生成数字人视频;Google发布了AI Edge Gallery,可在手机本地运行大语言模型;Rork则提供了一键生成跨平台APP的功能。

🚀DeepSeek R1模型已完成0528版本迭代升级。用户可以通过官方网页、APP或小程序进行测试,API接口和使用方式保持不变。虽然官方未提供具体更新细节,但据livecodebench测试显示,该版本性能已与o3模型相当。

🎭OmniConsistency是一个基于Flux-dev框架开发的风格迁移模型,其在人物一致性保持方面表现优于GPT-4O原生模型。用户可在Hugging Face在线体验空间上试玩。

🗣️腾讯开源了HunyuanVideo-Avatar数字人生成系统,用户仅需输入音频文件和角色图片,就能自动生成具有自然肢体动作和表情的数字人视频。用户可以直接访问官方在线体验。

📱Google开源了AI Edge Gallery,这是一款实验性应用,可在手机上本地运行大语言模型。目前已发布安卓版,iOS版本即将推出。代码完全开源。

📱Rork可以一键生成基于React Native + Expo的App,支持Android和iOS,并支持在线编译,用户可以通过Expo Go在手机上进行测试。但每月50美元250条消息的定价,对个人开发者来说可能较高。

DeepSeek R1 完成 0528 版本迭代升级,性能比肩 o3

DeepSeek 在官方微信群发布消息称,其 R1 模型已完成小版本迭代升级(版本号 DeepSeek-R1-0528)[1]。用户可通过官方网页、APP 或'深度思考'小程序进行测试,API 接口和使用方式保持不变。

虽然官方未提供具体更新细节,但据 livecodebench 测试显示,该版本性能已与 o3 模型相当。

OmniConsistency:GPT-4O 级的人物风格迁移模型

OmniConsistency[2] 是一个媲美 GPT-4O 的风格迁移模型,基于 Flux-dev 框架开发,兼容任意 Flux LoRA 适配器。在人物一致性保持方面,其表现甚至优于 GPT-4O 原生模型。

佬们可以直接在 Hugging Face 在线体验空间[3] 上试玩

腾讯开源 HunyuanVideo-Avatar:语音驱动生成数字人

腾讯正式开源 HunyuanVideo-Avatar[4] 数字人生成系统,仅需输入音频文件和角色图片,就能自动生成具有自然肢体动作和表情的数字人视频。

从官方演示视频来看,其生成效果相当不错。佬们可以直接访问官方[5]在线体验。

Google 开源 AI Edge Gallery:手机本地运行大语言模型

Google AI Edge Gallery[6] 是一款开源的实验性应用,让你能在手机上本地运行大语言模型。

目前安卓版已发布(代码完全开源,佬们可以直接在 release 下载编译好的 apk[7]),iOS 版本也即将推出。

Rork:一键生成跨平台APP

Rork[8] 可以直接生成基于 React Native + Expo 的 App(支持Android 和 iOS),并且支持在线编译,并通过 Expo Go 立即在手机上进行测试。

不过每月 50 美元 250 条消息的定价,对于个人开发者来说确实有点小贵。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R1 OmniConsistency HunyuanVideo-Avatar AI Edge Gallery Rork
相关文章