微信 AI 搜索接入 DeepSeek；百度文心大模型 4.5系列即将开源；马斯克宣布“地球上最聪明的AI” Grok3即将发布

原创小茸茸 2025-02-17 09:20 重庆

DeepSeek 官方推荐的 R1 最佳部署设置；微软推出 OmniParser V2.0：将大语言模型转化为 GUI 交互智能体；Light-A-Video 开源的无需训练视频重打光技术

百度文心大模型 4.5 系列即将开源

百度宣布^[1]将在未来几个月中陆续推出文心大模型 4.5 系列，并于 6 月 30 日起正式开源。

除此之外，百度搜索公众号^[2]发文表示：为丰富更多元化的搜索体验，百度搜索将全面接入 DeepSeek 和文心大模型最新的深度搜索功能。

变天了？

DeepSeek 官方推荐的 R1 最佳部署设置

DeepSeek R1 现已成为 Hugging Face 上有史以来最受欢迎的模型之一。官方推特发布了 R1 部署的最佳体验推荐设置，主要包括以下几点：

无系统提示词

Temperature：0.6

搜索和文件上传的官方提示词^[3]

强制添加 <think> 以缓减模型跳过推理^[4]

目前，DeepSeek R1 已有数千个变体，下载量超过 1000 万次，成为下载增长最快的开源模型之一！

微软推出 OmniParser V2.0：将大语言模型转化为 GUI 交互智能体

微软的 OmniParser^[5] 近日发布了 V2 更新，这一更新旨在将任何大语言模型（LLM）转化为能够理解和交互图形用户界面（GUI）的智能体。

与前一代^[6]相比，OmniParser V2 在检测更小可交互元素的准确性和推理速度上有了显著提升。目前，代码和模型均已开源。

马斯克宣布“地球上最聪明的 AI” Grok 3 即将发布

2 月 16 日，马斯克宣布^[7]，“地球上最聪明的 AI” Grok 3 将于太平洋时间周一晚上 8 点（北京时间 2 月 18 日 12 点）发布，届时将进行现场演示。

现在你已经可以在 Grok 网页版^[8]看到切换模型的选项了。

Light-A-Video 开源的无需训练视频重打光技术

Light-A-Video^[9] 是一个开源的无需训练的视频重打光技术，效果类似于 IC-Light^[10]，但特别之处在于它支持视频处理。

目前代码已经开源，尽管演示视频似乎最多支持 2 秒，但生成的效果还是很不错的。