三花AI 前天 10:50
GPT-4O 级的人物风格迁移模型;Rork一键生成跨平台APP;腾讯开源HunyuanVideoAvatar语音驱动生成数字人
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文概述了近期AI领域的多个重要进展。DeepSeek R1模型完成迭代升级,性能媲美O3;OmniConsistency作为风格迁移模型,在人物一致性保持上表现出色;腾讯开源HunyuanVideo-Avatar数字人生成系统;Google开源AI Edge Gallery,支持手机本地运行大语言模型;Rork则提供了一键生成跨平台APP的解决方案。这些进展涵盖了模型性能提升、风格迁移、数字人生成以及移动端AI应用等多个方面。

🚀DeepSeek R1模型完成0528版本迭代升级,经livecodebench测试,性能已与O3模型相当,用户可通过官方网页、APP或小程序进行测试。

🎨OmniConsistency是一个媲美GPT-4O的风格迁移模型,基于Flux-dev框架开发,兼容任意Flux LoRA适配器,在人物一致性保持方面表现优异,可在Hugging Face在线体验。

🎭腾讯开源HunyuanVideo-Avatar数字人生成系统,仅需音频文件和角色图片,即可生成具有自然肢体动作和表情的数字人视频,并提供在线体验。

📱Google开源AI Edge Gallery,这是一款实验性应用,能在手机上本地运行大语言模型,目前已发布安卓版本,iOS版本即将推出。

原创 小茸茸 2025-05-29 09:35 重庆

DeepSeek R1 完成 0528 版本迭代升级,性能比肩 o3;OmniConsistency:GPT-4O 级的人物风格迁移模型;Google 开源AI Edge Gallery:手机本地运行大语言模型;Rork一键生成跨平台APP

DeepSeek R1 完成 0528 版本迭代升级,性能比肩 o3

DeepSeek 在官方微信群发布消息称,其 R1 模型已完成小版本迭代升级(版本号 DeepSeek-R1-0528)[1]。用户可通过官方网页、APP 或'深度思考'小程序进行测试,API 接口和使用方式保持不变。

虽然官方未提供具体更新细节,但据 livecodebench 测试显示,该版本性能已与 o3 模型相当。

DeepSeek R1-0528 官方模型库: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

OmniConsistency:GPT-4O 级的人物风格迁移模型

OmniConsistency[2] 是一个媲美 GPT-4O 的风格迁移模型,基于 Flux-dev 框架开发,兼容任意 Flux LoRA 适配器。在人物一致性保持方面,其表现甚至优于 GPT-4O 原生模型。

佬们可以直接在 Hugging Face 在线体验空间[3] 上试玩

OmniConsistency 官方模型页面: https://huggingface.co/showlab/OmniConsistencyOmniConsistency 在线演示: https://huggingface.co/spaces/yiren98/OmniConsistency

腾讯开源 HunyuanVideo-Avatar:语音驱动生成数字人

腾讯正式开源 HunyuanVideo-Avatar[4] 数字人生成系统,仅需输入音频文件和角色图片,就能自动生成具有自然肢体动作和表情的数字人视频。

从官方演示视频来看,其生成效果相当不错。佬们可以直接访问官方[5]在线体验。

HunyuanVideo-Avatar 开源主页: https://huggingface.co/tencent/HunyuanVideo-AvatarHunyuanVideo-Avatar 在线演示: http://hunyuan.tencent.com/modelSquare/home/play?modelId=126

Google 开源 AI Edge Gallery:手机本地运行大语言模型

Google AI Edge Gallery[6] 是一款开源的实验性应用,让你能在手机上本地运行大语言模型。

目前安卓版已发布(代码完全开源,佬们可以直接在 release 下载编译好的 apk[7]),iOS 版本也即将推出。

Google AI Edge 官方 GitHub: https://github.com/google-ai-edge/galleryGallery 最新发布页: https://github.com/google-ai-edge/gallery/releases

Rork:一键生成跨平台APP

Rork[8] 可以直接生成基于 React Native + Expo 的 App(支持Android 和 iOS),并且支持在线编译,并通过 Expo Go 立即在手机上进行测试。

不过每月 50 美元 250 条消息的定价,对于个人开发者来说确实有点小贵。

Rork 官网: https://rork.com/


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R1 OmniConsistency HunyuanVideo-Avatar AI Edge Gallery AI模型
相关文章