原创 小茸茸 2024-11-14 09:16 重庆
百度自由画布:全新创作工具开放公测;RMBG-2.0:开源背景去除模型性能大幅提升;DeepSeek 开源 JanusFlow:超越 LLaVA-v1.5 的多模态模型;16 岁少年三小时搓出的海报神器
百度自由画布:全新创作工具开放公测
自由画布[1]是 2024 百度世界大会上创始人李彦宏展示的一款全新创作工具。正如其名,用户可以将任何内容(如图片、视频、语音、PDF、文档等)拖放到画布中进行理解和编辑,功能看起来相当不错。目前已经开放公测申请,有需要的用户不要错过。你可以在公测申请[2]提交审核。
RMBG-2.0:开源背景去除模型性能大幅提升
RMBG-2.0[3] 是 BRIA AI 推出的全新开源 SOTA 背景去除模型,其性能比肩知名付费背景去除工具 remove.bg。2.0 的性能提升非常大,从 1.4 版本的 73.26% 提升到了 90.14%。我试了下,效果非常不错!
DeepSeek 开源 JanusFlow:超越 LLaVA-v1.5 的多模态模型
JanusFlow[4] 开源了 Janus 系列中的 JanusFlow,这是一个统一的多模态理解和生成模型,能够同时处理图像理解和生成任务。在视觉理解基准测试中,JanusFlow 的表现超越了 LLaVA-v1.5 和 Qwen-VL-Chat,并且能够生成分辨率为 384×384 的图像。坐等集成到 API,俺充了 50 用了半年了。
16 岁少年三小时搓出的海报神器
Text Behind Image[5] 是 X 上爆火的一个工具,它能在图片角色与背景之间巧妙添加文字,瞬间生成高大上的海报。这款工具的作者是一位年仅 16 岁的少年,他用 cursor 和 v0 仅花了三个小时就搓出了这个工具。
除了原版外,还有一众大佬的实现版本,例如 @dreamingtulpa[6] 开发的和 gradio 框架开发的版本[7],都是免费的,可以玩玩。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
自由画布官网: https://wenku.baidu.com/pcactivity/freeBoard
[2]自由画布公测申请: https://tanbi.baidu.com/h5apptopic/browse/freecanvasreservation
[3]RMBG-2.0 模型页面: https://huggingface.co/spaces/briaai/BRIA-RMBG-2.0
[4]JanusFlow 开源项目: https://github.com/deepseek-ai/Janus
[5]Text Behind Image 官网: https://textbehindimage.rexanwong.xyz/
[6]dreamingtulpa 版本: https://promptcache.com/tools/depth-text
[7]gradio 框架开发的版本: https://huggingface.co/spaces/ysharma/Text_Behind_Image