原创 小茸茸 2025-02-17 09:20 重庆
DeepSeek 官方推荐的 R1 最佳部署设置;微软推出 OmniParser V2.0:将大语言模型转化为 GUI 交互智能体;Light-A-Video 开源的无需训练视频重打光技术
百度文心大模型 4.5 系列即将开源
百度宣布[1]将在未来几个月中陆续推出文心大模型 4.5 系列,并于 6 月 30 日起正式开源。
除此之外,百度搜索公众号[2]发文表示:为丰富更多元化的搜索体验,百度搜索将全面接入 DeepSeek 和文心大模型最新的深度搜索功能。
变天了?
DeepSeek 官方推荐的 R1 最佳部署设置
DeepSeek R1 现已成为 Hugging Face 上有史以来最受欢迎的模型之一。官方推特发布了 R1 部署的最佳体验推荐设置,主要包括以下几点:
无系统提示词
Temperature:0.6
搜索和文件上传的官方提示词[3]
强制添加 <think>
以缓减模型跳过推理[4]
目前,DeepSeek R1 已有数千个变体,下载量超过 1000 万次,成为下载增长最快的开源模型之一!
微软推出 OmniParser V2.0:将大语言模型转化为 GUI 交互智能体
微软的 OmniParser[5] 近日发布了 V2 更新,这一更新旨在将任何大语言模型(LLM)转化为能够理解和交互图形用户界面(GUI)的智能体。
与前一代[6]相比,OmniParser V2 在检测更小可交互元素的准确性和推理速度上有了显著提升。目前,代码和模型均已开源。
马斯克宣布“地球上最聪明的 AI” Grok 3 即将发布
2 月 16 日,马斯克宣布[7],“地球上最聪明的 AI” Grok 3 将于太平洋时间周一晚上 8 点(北京时间 2 月 18 日 12 点)发布,届时将进行现场演示。
现在你已经可以在 Grok 网页版[8]看到切换模型的选项了。
Light-A-Video 开源的无需训练视频重打光技术
Light-A-Video[9] 是一个开源的无需训练的视频重打光技术,效果类似于 IC-Light[10],但特别之处在于它支持视频处理。
目前代码已经开源,尽管演示视频似乎最多支持 2 秒,但生成的效果还是很不错的。
微信 AI 搜索接入 DeepSeek
微信最近在其搜索功能中灰度测试了 DeepSeek-R1 大模型的集成。用户可以在对话框顶部的搜索入口看到“AI 搜索”字样,点击后即可免费使用 DeepSeek-R1 模型,支持深度推理和快速回答。
目前,这一功能还处于灰度测试阶段,仅对部分用户开放。
微信的 AI 搜索结合了微信自身的大量数据和 DeepSeek-R1 的联网信息整合能力,预计将成为国内领先的 AI 搜索工具。
而且,微信作为国民级 APP,大幅提升了 AI 的普及度。不过,我的微信号没灰度到,你们呢?
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
百度宣布文心大模型 4.5 系列开源: https://mp.weixin.qq.com/s/VEPMufLTlSyysy1cmyHk4Q
[2]百度搜索公众号发文: https://mp.weixin.qq.com/s/0jynTG5SKHXuHUFmnVSBag
[3]DeepSeek R1 官方提示词: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files
[4]DeepSeek R1 推理优化: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae
[5]OmniParser V2 开源项目: https://huggingface.co/microsoft/OmniParser-v2.0
[6]OmniParser 前一代介绍: https://sanhua.himrr.com/news/9a29bdb6-b155-48de-8cb5-790292a4a604
[7][8]Grok 官网: https://grok.com/
[9]Light-A-Video 开源项目官网: https://bujiazi.github.io/light-a-video.github.io/
[10]IC-Light 技术介绍: https://sanhua.himrr.com/news/79151b05-0b83-43bc-ad7d-36b1bc53c8f0