原创 小茸茸 2025-05-29 09:35 重庆
DeepSeek R1 完成 0528 版本迭代升级,性能比肩 o3;OmniConsistency:GPT-4O 级的人物风格迁移模型;Google 开源AI Edge Gallery:手机本地运行大语言模型;Rork一键生成跨平台APP
DeepSeek R1 完成 0528 版本迭代升级,性能比肩 o3
DeepSeek 在官方微信群发布消息称,其 R1 模型已完成小版本迭代升级(版本号 DeepSeek-R1-0528)[1]。用户可通过官方网页、APP 或'深度思考'小程序进行测试,API 接口和使用方式保持不变。
虽然官方未提供具体更新细节,但据 livecodebench 测试显示,该版本性能已与 o3 模型相当。
DeepSeek R1-0528 官方模型库: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
OmniConsistency:GPT-4O 级的人物风格迁移模型
OmniConsistency[2] 是一个媲美 GPT-4O 的风格迁移模型,基于 Flux-dev 框架开发,兼容任意 Flux LoRA 适配器。在人物一致性保持方面,其表现甚至优于 GPT-4O 原生模型。
佬们可以直接在 Hugging Face 在线体验空间[3] 上试玩
OmniConsistency 官方模型页面: https://huggingface.co/showlab/OmniConsistencyOmniConsistency 在线演示: https://huggingface.co/spaces/yiren98/OmniConsistency
腾讯开源 HunyuanVideo-Avatar:语音驱动生成数字人
腾讯正式开源 HunyuanVideo-Avatar[4] 数字人生成系统,仅需输入音频文件和角色图片,就能自动生成具有自然肢体动作和表情的数字人视频。
从官方演示视频来看,其生成效果相当不错。佬们可以直接访问官方[5]在线体验。
HunyuanVideo-Avatar 开源主页: https://huggingface.co/tencent/HunyuanVideo-AvatarHunyuanVideo-Avatar 在线演示: http://hunyuan.tencent.com/modelSquare/home/play?modelId=126
Google 开源 AI Edge Gallery:手机本地运行大语言模型
Google AI Edge Gallery[6] 是一款开源的实验性应用,让你能在手机上本地运行大语言模型。
目前安卓版已发布(代码完全开源,佬们可以直接在 release 下载编译好的 apk[7]),iOS 版本也即将推出。
Google AI Edge 官方 GitHub: https://github.com/google-ai-edge/galleryGallery 最新发布页: https://github.com/google-ai-edge/gallery/releases
Rork:一键生成跨平台APP
Rork[8] 可以直接生成基于 React Native + Expo 的 App(支持Android 和 iOS),并且支持在线编译,并通过 Expo Go 立即在手机上进行测试。
不过每月 50 美元 250 条消息的定价,对于个人开发者来说确实有点小贵。
Rork 官网: https://rork.com/
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!