原创 小茸茸 2025-03-17 09:51 重庆
Cohere 开源 Command A:企业级大模型,成本效益超越 GPT-4o 和 DeepSeek-V3;百度发布文心大模型 4.5 及 X1;LBM:单步实现多功能图片风格转换;Thera:首个内置物理观测模型的任意尺度超分辨率技术
Thera:首个内置物理观测模型的任意尺度超分辨率技术
Thera 是第一个具有内置物理观测模型的任意尺度超分辨率技术,从基准测试来看,性能非常的好。
佬们可以在官方演示[1]上玩一下,提供的几个 demo 效果看起来非常不错
Thera 官方演示: https://huggingface.co/spaces/prs-eth/thera
Cohere 开源 Command A:企业级大模型,成本效益超越 GPT-4o 和 DeepSeek-V3
Command A[2] 是 Cohere 开源的一款专为企业需求优化的大模型,显著降低了硬件成本。
官方宣称,在与 GPT-4o 和 DeepSeek-V3 的对比中,Command A 在企业级任务中表现同样出色,效率更高。更重要的是,相较于使用 API,自部署访问成本降低了 50%。
完整细节可以查看Command A[3] 的官方博客。
Command A 官方博客: https://cohere.com/blog/command-a
Command A 官方博客: https://cohere.com/blog/command-a
LBM:单步实现多功能图片风格转换
LBM[4](Latent Bridge Matching)是一种图片风格转换技术,它能够在单一步骤中实现多种图生图任务,如对象移除、法线和深度调整以及重新照明等。
目前,LBM 技术已经开源,感兴趣的朋友可以在线体验[5]感受下
LBM 技术官网: https://gojasper.github.io/latent-bridge-matching/
LBM 在线体验: https://huggingface.co/spaces/jasperai/LBM_relighting
百度发布文心大模型 4.5 及 X1
百度昨天发布了新的文心大模型[6],其中包括基础模型 4.5 和推理模型 X1。百度宣称 X1 的能力接近 DeepSeek R1,价格便宜了一半。
网友们对实际效果的评价一般,CEO 李彦宏表示后续会开源,正如今年 2 月份的宣布[7],4 月 1 日后文心也会全面免费。
怎么说呢,难用归难用,能开源总是好的。
文心大模型官网: https://yiyan.baidu.com/X1
2 月份宣布详情: https://sanhua.himrr.com/news/215588c4-510f-43b0-a09f-8b047e01e423
米哈游创始人蔡浩宇推出 AI 驱动的互动叙事游戏《群星低语》
“Whispers from the Star”(群星低语)是一款由米哈游(miHoYo)的创始人蔡浩宇创立的游戏开发公司 Anuttacon 打造的科幻题材互动叙事游戏。这款游戏以 AI 技术为核心,旨在重新定义互动叙事的体验。
官方的目标是突破传统对话树的限制,提供开放式、个性化和沉浸式的实时交互体验。
已经开启封闭内测阶段,仅支持苹果 iOS 12 以上设备,有兴趣的可以去官网[8]申请体验。
Whispers from the Star 官网: https://wfts.anuttacon.com/
腾讯混元即将开源全新 3D 模型
腾讯混元[9]宣布即将发布一款全新的 3D 模型[10],大概率会开源,大家可以期待一下。
腾讯混元官方 X 平台: https://x.com/TXhunyuan
腾讯混元3D: https://3d.hunyuan.tencent.com/
WeShopAI:一个闭源的虚拟试穿
WeShopAI[11] 是又一个虚拟试穿的在线演示,类似于可灵的虚拟试穿。同样,它只是调用了其 API,并没有开源。
效果还行,佬们可以玩玩看,感觉大概率是给其引流用的?
WeShopAI 虚拟试穿演示: https://huggingface.co/spaces/WeShopAI/WeShopAI-Virtual-Try-On
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!