三花AI 03月07日
腾讯开源混元图生视频模型;IDEs 内直接编辑代码;Windsurf Wave 4 支持实时预览和精准编辑;古典音乐生成模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文总结了近期AI领域的几项重要进展。OpenAI的ChatGPT for macOS更新,允许在IDE中直接编辑代码,极大提升了开发效率。腾讯开源了HunyuanVideo-I2V图像到视频生成框架,为视频创作提供了新工具。NotaGen发布了古典音乐生成模型,采用类似LLM的训练范式,为音乐创作带来更多可能性。Windsurf Wave 4新增Preview功能,支持前端代码的实时预览和精准编辑。Mistral AI推出了Mistral OCR,号称世界最强OCR,提供API调用,在表格、图形、数学公式等识别方面表现出色。这些技术进步预示着AI在各个领域应用的潜力。

💻 OpenAI ChatGPT for macOS 更新,允许在 IDEs 内直接编辑代码,极大地简化了代码的修改和生成流程,用户无需再手动复制粘贴,提高了开发效率,但目前仅对 ChatGPT Plus、Pro 和 Team 用户开放。

🎶 NotaGen 是一个专注于生成高品质古典音乐的模型,它采用了类似 LLM 的训练范式,在超过 160 万首音乐作品上进行预训练而来。官方已开源模型和代码,并提供了一个受 DeepSeekR1 启发的模型 Notagen-X,为古典音乐创作提供了新的可能性,但需要注意其输出的是 ABC & xml 文件而非音频文件。

🖼️ 腾讯开源 HunyuanVideo-I2V 图像到视频生成框架,该框架包含 LoRA 训练脚本和 ComfyUI 集成,支持用户将图像转化为视频,并且允许月活跃用户少于 1 亿的用户将其用于商业目的,但推理 360p 视频需要 80G+ 的显存。

👓 Mistral AI 推出 Mistral OCR,号称世界最强 OCR,提供 API 调用,支持表格、图形、数学公式、阿拉伯文等多种类型的识别,用户可以在 Mistral 的 AI 助手 Le Chat 中试用,接口定价为每 1000 页 1 美元。

原创 小茸茸 2025-03-07 09:44 重庆

OpenAI ChatGPT for macOS 更新:IDEs 内直接编辑代码;NotaGen 古典音乐生成;Windsurf Wave 4 新增 Preview 功能;Mistral AI 推出世界最强 OCR:Mistral OCR

OpenAI 推出 ChatGPT for macOS 更新:IDEs 内直接编辑代码

OpenAI 推出的 ChatGPT for macOS 现在可以直接在 IDEs 中编辑代码。这一重大更新[1]目前仅对 ChatGPT Plus、Pro 和 Team 用户开放,稍晚一些将对免费用户推出。

此前使用桌面版本的 ChatGPT 来改写或生成代码后,需要手动复制粘贴,现在可以自动插入或手动 apply 代码,方便太多了!

OpenAI 官方推文: https://x.com/OpenAIDevs/status/1897700857833193955

腾讯开源混元图生视频模型

继腾讯成功开源 HunyuanVideo 后,他们终于推出了HunyuanVideo-I2V[2] 一个新的图像到视频生成框架,同时还包括 LoRA训练脚本、ComfyUI 集成等。推理 360p 的视频官方建议使用 80G+ 的显存。

对于月活跃用户少于 1 亿的佬们,可以放心的将该模型用于商业目的。

HunyuanVideo-I2V 官方 GitHub 仓库: https://github.com/Tencent/HunyuanVideo-I2V

NotaGen 古典音乐生成模型

NotaGen[3] 是一个专注于生成高品质古典音乐的模型。它采用了类似 LLM 的训练范式,在超过 160 万首音乐作品上进行预训练而来。

就在昨天,官方开源了模型和代码,有需要的朋友们不要错过。本次开源还包括了一个受 DeepSeekR1 启发的模型 Notagen-X,本地部署需要 24G 显存。

值得注意的是,该模型输出的不是音频文件,而是 ABC & xml 文件。

NotaGen 模型官网: https://electricalexis.github.io/notagen-demo/

Windsurf Wave 4 发布:新增 Preview 功能,支持实时预览和精准编辑

Windsurf Wave 4 正式发布,该版本主要新增了 Preview 功能。生成的前端代码可以在编辑器中实时预览,并且支持指哪改哪(类似 V0),能够精准地将上下文发送给 Windsurf。

更多更新内容,佬们可以前往官方博客[4]查看。

Windsurf Wave 4 官方博客: https://codeium.com/blog/windsurf-wave-4

Mistral AI 推出号称世界最强 OCR:Mistral OCR

Mistral OCR[5] 是由 Mistral AI 推出的号称世界最强 OCR,提供 API 调用,官网的演示案例包括表格、图形、数学公式、阿拉伯文等。

该接口的定价为每 1000 页 1 美元,如果效果真的好,性价比还是挺高的,可以在 Mistral 的 AI 助手 Le Chat 中试用。

Mistral OCR 官网: https://mistral.ai/news/mistral-ocr

如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

ChatGPT HunyuanVideo-I2V NotaGen Mistral OCR
相关文章