三花AI 01月22日
Cursor 获 1.05 亿美金 B 轮融资,打造超越人类程序员的 AI;开源线稿上色工具;黑森林实验室轻松定制你的图像模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文汇总了近期AI领域的多个前沿技术进展。包括轻量级多语言TTS模型Kokoro-TTS,它以极快的生成速度和82M的参数量引人注目;中国科学技术大学推出的RAIN系统,可在RTX4090上实现低延迟动画生成;MangaNinja则是一款开源线稿上色工具,能根据参考图上色。此外,OpenAI的ChatGPT新增任务功能,支持单次和计划任务;FramePainter通过视频扩散模型实现交互式图像编辑;Cursor获1.05亿美金B轮融资,致力于打造超越人类程序员的AI;黑森林实验室推出FLUX Pro Finetuning API,方便用户定制图像模型。这些技术覆盖了文本生成、图像处理、动画制作等多个领域。

🗣️ Kokoro-TTS是一个轻量级多语言TTS模型,仅有82M参数,支持中文,生成速度极快,但中文效果略带“大佐味”。社区还开发了基于Kokoro的开源音色混合工具。

🎨 RAIN是由中国科学技术大学推出的开源系统,能够在单个RTX 4090显卡上实现低延迟(1.5秒)实时生成动画,但在消费级设备的延迟和分辨率仍有提升空间。

🧑‍💻 OpenAI 的 ChatGPT 推出了全新的任务(Task)功能,支持单次或计划任务,但目前仅对付费用户开放。用户可以查看官方完整教程了解具体用法。

🖼️ FramePainter是一个使用视频扩散模型实现的交互式图像编辑模型,在训练数据较少的情况下,编辑生成的效果更自然、流畅。目前还没有发布源码。

🛠️ 黑森林实验室最新发布的FLUX Pro Finetuning API,让用户能轻松使用自己的图片来定制FLUX Pro模型,例如将logo融入生成的图像中。

原创 小茸茸 2025-01-20 13:40 河北

Kokoro-TTS轻量级多语言TTS模型;RTX4090 上的低延迟动画生成系统;ChatGPT任务功能支持单次和计划任务;FramePainter视频扩散模型驱动交互式图像编辑;黑森林实验室FLUX Pro Finetuning API

Kokoro-TTS:轻量级多语言 TTS 模型

Kokoro-TTS[1] 是近期比较火的一个开源 TTS 模型,仅有 82M 参数,支持中文,并且生成速度极快。 不过中文效果略显一般,带有一种独特的“大佐味”,但它的生成速度还是非常的快。佬们可以自己试试[2],感受下。 此外,社区还开发了一个基于 Kokoro 的开源音色混合工具[3]。,该工具能够将多种不同的音色混合,创造出全新的音色

RAIN:RTX 4090 上的低延迟动画生成系统

RAIN[4] 是由中国科学技术大学推出的一个开源系统,能够在单个 RTX 4090 显卡上实现低延迟(1.5 秒)实时生成动画。 目前代码尚未完全发布,在消费级设备的延迟和分辨率仍有提升空间。

MangaNinja:开源线稿上色工具

MangaNinja[5] 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo[6]

OpenAI 推出 ChatGPT 任务功能:支持单次和计划任务

正如之前的泄露[7],OpenAI 的 ChatGPT 推出了全新的任务(Task)功能[8],支持单次或计划任务!目前,这一功能仅对付费用户开放。具体用法可以查看官方完整教程[9]

FramePainter:视频扩散模型驱动的交互式图像编辑

FramePainter[10] 是一个使用视频扩散模型实现的交互式图像编辑模型。与之前的图像编辑模型相比,FramePainter 在训练数据较少的情况下,编辑生成的效果更自然、流畅。目前还没有发布源码,大家可以期待一下。

Cursor 获 1.05 亿美金 B 轮融资,打造超越人类程序员的 AI

Cursor 官方发推表示获得 1.05 亿美金 B 轮融资,投资方包括 Thrive Capital、Andreessen Horowitz、Benchmark 以及现有投资者。官方博客《Series B and Automating Code》[11]中显示,这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。目前,Cursor 已被数百万程序员作为首选编辑器,每天编码超过十亿个字符,年收入已经超过 1 亿美元。感谢各位付费用户让我白嫖 Cursor!

黑森林实验室推出 FLUX Pro Finetuning API:轻松定制你的图像模型

黑森林实验室(Black Forest Labs)最新发布的 FLUX Pro Finetuning API[12],让任何人都能轻松使用自己的图片来定制 FLUX Pro 模型。 这个 API 的亮点在于它的易用性和灵活性,最简单的例子就是你可以把你的 logo 融入生成的图像中,实现营销和推广。想了解更多详情,可以查看官方博客。


非常抱歉最近拖更,临近新年事情有点杂乱,多多体谅!如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

Kokoro-TTS 项目主页: https://huggingface.co/hexgrad/Kokoro-82M

[2]

Kokoro-TTS 在线体验: https://huggingface.co/spaces/hexgrad/Kokoro-TTS

[3]

Kokoro-TTS 音色混合工具: https://huggingface.co/spaces/ysharma/Make_Custom_Voices_With_KokoroTTS

[4]

RAIN 项目页面: https://pscgylotti.github.io/pages/RAIN/

[5]

MangaNinja 官网: https://johanan528.github.io/MangaNinjia/

[6]

MangaNinja 在线演示: https://huggingface.co/spaces/fffiloni/MangaNinja-demo

[7]

往期OpenAI 任务功能泄露: https://sanhua.himrr.com/news/ce0f5cc7-8c05-4148-bf12-788d96c56b45

[8]

OpenAI 官方任务功能公告: https://x.com/OpenAI/status/1879267274185756896

[9]

ChatGPT 计划任务使用教程: https://help.openai.com/en/articles/10291617-scheduled-tasks-in-chatgpt

[10]

FramePainter GitHub 仓库: https://github.com/YBYBZhang/FramePainter

[11]

Cursor 官方博客: https://www.cursor.com/blog/series-b

[12]

FLUX Pro Finetuning API 官方博客: https://blackforestlabs.ai/announcing-the-flux-pro-finetuning-api/


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

TTS模型 动画生成 图像编辑 ChatGPT AI程序员
相关文章