三花AI 2024年10月25日
HuggingChat MacOS 原生客户端开源;微软将 UI 截图转换为结构化数据;谷歌实时混合提示词生成音乐;Flux.1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了多款AI领域的新成果,包括Freepik推出的Flux.1 Lite、Hugging Face开源的HuggingChat MacOS原生客户端、微软的OmniParser、Anthropic Claude AI的分析工具、Perplexity的MacOS客户端以及谷歌的MusicFXDJ。这些成果涵盖了模型优化、客户端开发、数据处理、音乐生成等多个方面。

🥳Freepik推出Flux.1 Lite,它从dev模型蒸馏而来,RAM占用减少7GB,速度提升23%,Freepik是专注AI素材的公司,提供多种素材。

💻HuggingChat原生macOS客户端开源,用Swift编写,提供类似Spotlight搜索体验,支持多种功能,处于早期beta阶段,可免费使用开源大模型。

📱微软推出OmniParser,能将UI屏幕截图转换为结构化数据,基于YOLOv8微调,功能强大,可提升基于LLM的UI Agent性能。

📊Anthropic Claude AI推出分析工具,能自动编写执行JavaScript清洗分析数据,结合Artifacts创建交互式可视化图表,处于功能预览阶段。

🎵谷歌推出MusicFXDJ,用户通过输入提示词实时混合曲风和乐器生成音乐,能按提示词重要性混合,更精确控制音乐风格。

原创 小茸茸 2024-10-25 09:19 重庆

Freepik 推出 Flux.1 Lite;微软 OmniParser;Anthropic Claude AI 推出分析工具;Perplexity 发布 MacOS 客户端;谷歌 MusicFXDJ:实时混合提示词生成音乐

Freepik 推出 Flux.1 Lite

Flux.1 Lite[1] 是从 dev 模型蒸馏而来的,与原始的 bfloat16 模型相比,RAM 占用减少了 7GB,速度提升了 23%。好久没更新 Flux 生态的内容了,顺带介绍下 Freepik[2],一个专注 AI 素材的公司,包括图标、插图、视频等。

Hugging Face 开源 HuggingChat MacOS 原生客户端

HuggingChat[3] 原生 macOS 客户端现已开源。这款应用完全使用 Swift 编写,提供类似 Spotlight 的搜索体验,支持 Markdown 渲染、网页浏览和代码语法高亮。目前处于早期 beta 阶段,用户可以免费使用所有顶级开源大模型。

微软推出 OmniParser:将 UI 截图转换为结构化数据

OmniParser[4] 是一款由微软推出的通用屏幕解析工具,它能够将 UI 屏幕截图转换为结构化数据,从而显著提升基于 LLM 的 UI Agent 的性能。这个模型基于 YOLOv8 微调而来,支持提取任意手机、PC、APP 的截图,功能非常强大。有了这个模型,马上就会有一堆 Computer use 的开源替代了。

Anthropic Claude AI 推出分析工具

Claude AI 引入了一个内置的分析工具[5],能够通过自动编写和执行 JavaScript 对数据进行清洗和分析,还能结合 Artifacts 创建交互式可视化图表。这个工具潜力挺大,可以用来辅助分析日志、SEO 报告、销售数据等等,目前还处于功能预览阶段,需要手动启用。

Perplexity 发布 MacOS 客户端

Perplexity 刚刚推出了 MacOS 客户端[6] ,用户可以通过快捷键 ⌘ + ⇧ + P 快速唤起搜索功能。发布没多久,就攀升至 Mac App Store 免费榜的榜首,太强了。

谷歌 MusicFXDJ:实时混合提示词生成音乐

MusicFXDJ[7] 是谷歌推出的一款创新音乐生成工具,用户可以通过输入不同的提示词,实时混合曲风和乐器,生成全新的音乐作品。与 Suno 等传统文生音乐工具不同,MusicFXDJ 能够根据用户的多个提示词按重要性进行混合,从而更精确地控制音乐风格。完整报告[8]详细介绍了其工作原理,感兴趣的用户可以深入学习。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要感谢你能看到这里,万水千山总是情,打赏一元行不行,哈哈哈哈哈哈哈!

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

Flux.1 Lite 模型详情: https://huggingface.co/Freepik/flux.1-lite-8B-alpha

[2]

Freepik 公司官网: https://x.com/freepik

[3]

HuggingChat macOS 客户端: https://github.com/huggingface/chat-macOS

[4]

OmniParser 官网: https://huggingface.co/microsoft/OmniParser

[5]

Claude AI 分析工具: https://www.anthropic.com/news/analysis-tool

[6]

Perplexity 公司 MacOS 客户端: https://t.co/hxLd3rJwe6

[7]

谷歌推出的创新音乐生成工具: http://labs.google/musicfx

[8]

完整报告: https://deepmind.google/discover/blog/new-generative-ai-tools-open-the-doors-of-music-creation/


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Freepik 微软 Anthropic Claude AI Perplexity 谷歌
相关文章