十字路口Crossing 2024年10月29日
Runway AI 删除开源模型引关注 | ChatGPT 周活用户破 2 亿 | 阿里重磅开源多模态模型 Qwen2-VL
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期 AI 新闻速递涵盖了近期 AI 领域的重要事件,包括 Runway 删除开源模型引发争议、ChatGPT 周活用户突破 2 亿、Character.AI 裁员、智谱 AI 发布新一代基座模型、阿里开源多模态模型 Qwen2-VL、通义网页版上线 PPT 创作功能、众擎机器人完成天使轮融资、Codeium 完成 1.5 亿美元 C 轮融资,以及谷歌 Gemini 发布 5 种 Study Smarter 新方案。这些事件反映了 AI 技术的快速发展和应用场景的不断拓展,同时也引发了对 AI 技术伦理和商业模式的思考。

🤔 Runway AI 删除开源模型引发关注:Runway AI 在未提前通知的情况下,突然删除了其在 Hugging Face 和 GitHub 两大开源社区上的开源模型,引发业界广泛关注。此次删除行为涉及 Stable Diffusion v1.5 模型,该模型由 Runway、Stability AI 和慕尼黑大学共同研发。目前,Runway 官方尚未对此次删除行为作出任何公开回应,其社交平台上一切如常。业界对 Runway 此举的原因有多种猜测,主要指向两个可能:一是与 Stability AI 之间的利益纠纷,二是涉及侵权问题,Runway 可能在销毁证据。此前,Runway 和 Stability AI 在 Stable Diffusion 模型的开源发布上存在分歧,双方各执一词。此外,Runway、Stability AI 和其他几家 AI 公司曾因使用艺术家作品进行模型训练而面临集体诉讼。美国地区法院近期驳回了这些公司的上诉,允许艺术家进入列举证据的环节。Stable Diffusion 模型可能是这场诉讼的关键证据之一。

📈 ChatGPT 周活用户破 2 亿:OpenAI 的 AI 聊天机器人 ChatGPT 目前周活跃用户数量已经超过 2 亿,短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中,92% 正在使用其产品;自 7 月份发布 GPT-4o mini 以来,其自动 API 的使用量已翻了一番。首席执行官山姆・阿尔特曼(Sam Altman)在给该媒体的一份声明中表示:人们正在使用我们的工具,将其融入到日常生活中,在医疗保健和教育等领域发挥着真正的作用,可以帮助完成日常任务、解决棘手问题,还是释放创造力。

📉 Character.AI 上演 5% 裁员风波:据 The Information 报道,与谷歌达成重大交易不久后,美国人工智能创业公司 Character.AI 进行了至少 5% 的裁员,主要涉及营销和招聘岗位。在裁员前,Character.AI 拥有约 120 名员工。目前,Character.AI 将由总法律顾问 Dom Perella 临时领导。Character.AI 的剩余领导层必须说服 100 名左右的普通员工,在他们的原 CEO 以及不少加入谷歌的同事已经发财致富的情况下,跟着新的领导和新的任务继续坚持下去。这样 Character.AI 才有希望获得新的风险投资。Character.AI 曾大谈特谈其闭环策略,即训练自己的大模型,将该模型用于聊天机器人,然后将用户使用数据用于训练中。而现在,Character.AI 将开始使用其他公司开发的开源模型,并转向后期训练。

🚀 智谱 AI 发布新一代基座模型:在 KDD2024 大会上,智谱 AI 发布了新一代基座模型,包括语言模型 GLM-4-Plus、文生图模型 CogView-3-Plus、图像/视频理解模型 GLM-4V-Plus、视频生成模型 CogVideoX 等,这些模型在相应领域均达到了国际第一梯队的水平。智谱 AI 还在「清言 APP」上线了视频通话功能,并在 MaaS 平台上开放了 GLM-4-Flash API 的免费使用。

🌟 阿里重磅开源多模态模型 Qwen2-VL:阿里巴巴开源了最新视觉多模态模型 Qwen2-VL[1],根据测试数据显示,其 72B 模型在大部分指标超过了 OpenAI 的 GPT-c4o,Anthropic 的 Claude3.5-Sonnet 等著名闭源模型,成为目前最强多模态模型之一。Qwen2-VL 支持中文、英文、日文、韩文等众多语言,可以在 Apache 2.0 协议下进行商业化使用。同时阿里发布了 Qwen2-VL-72B 的 API,帮助开发者增强或开发多模态功能的生成式 AI 应用。

💻 通义网页版上线 PPT 创作功能:通义网页版上线「PPT 创作」功能,具备言之有物、设计精美、智能编排三大核心特点。PPT 创作功能完全免费,基于通义大模型打造。在通义网页版,音视频转文字产品「通义听悟」升级为「实时记录」,长文档阅读助手「通义智文」升级为「阅读助手」,与「PPT 创作」功能共同合并为通义效率,实现从信息搜集整理、内容理解再到内容创作的完整工作学习流。

🤖 众擎机器人完成天使轮融资,商汤领投:具身智能通用机器人研发商深圳市众擎机器人科技有限公司,完成天使轮及天使+轮共计近亿元的融资。两轮融资分别由商汤国香资本、弘晖基金领投,其他跟投方包括合肥滨湖金投和浔商资本等。对于接下来公司的发展计划和动向,众擎机器人计划在今年第四季度推出多款全尺寸人形机器人,内部称为「SE 系列」和「PM 系列」,身高范围为 1.65 m-1.80 m。这些机器人将应用于工业和家庭场景,特别是在高危作业、生产制造和智能装配领域,涵盖汽车、电池、半导体等多个行业。

💰 Codeium 完成 1.5 亿美元 C 轮融资:美国 AI 编程初创公司 Codeium 宣布,其已完成了 1.5 亿美元的 C 轮融资,本次融资由知名风投公司 General Catalyst 领投。融资后,这家 AI 初创公司估值达到 12.5 亿美元,现已成功步入行业独角兽行列。据悉,Codeium 由莫汉和他的儿时好友兼麻省理工学院校友道格拉斯・陈(Douglas Chen)创立于 2021 年。Codeium 平台主要依托于在公共代码库中训练的生成式 AI 模型而运行。该平台支持约 70 种编程语言,并集成了许多流行的开发环境,其中包括 Microsoft Visual Studio 和 IDE。目前公司有 80 名员工,为在竞争激烈的市场中取得更大成功,他们打算在 2025 年前再招 40 人。

📚 谷歌 Gemini 公布 5 种 Study Smarter 新方案:随着新学年的开始,谷歌推出了一系列新功能,旨在通过其智能助手 Gemini 帮助学生更智慧地学习。无论你是刚步入大学校园的新生,还是准备迎接新挑战的返校生,Gemini 都准备好了帮助你更高效地学习。这五种方案包括:利用权威教科书的提取知识:Gemini 可以从 Rice 大学的教育非营利项目 OpenStax 提供的学术教科书中提取信息;通过互动测验测试你的知识:Gemini 会逐个问题引导你,如果你在途中遇到困难,还会提供反馈和提示。支持上传学习材料,像专业人士一样助力分析:使用 Gemini Advanced,可以一次上传多达 10 份文件——比如课程大纲或你的笔记——并要求 Gemini 解释内容或创建定制的学习指南。Gemini 将深入研究你的材料,分解关键概念,根据你的课程材料提供练习题等。使用学习教练 Gem 获取个性化学习指导:Gemini Advanced 的订阅者可以访问 Gems,它们是任何主题的定制 AI 专家。预制的 Gem 学习教练可以帮助创建学习计划——包括进度检查,以确保你保持在正确的轨道上。对任何主题推荐多媒体信息讲解:Gemini 可以以易于理解的方式分解信息。从视频到图像到针对你正在学习的内容量身定制的真实生活示例。如果做好心理准备,一切准备都已经准备好了。——威廉・莎士比亚

原创 Yuki 2024-08-31 13:31 上海

翻翻小报,AI 新闻全知道

? Runway AI 删除开源模型引关注

? ChatGPT 周活用户破 2 亿

? Character. AI 上演 5% 裁员风波

? 智谱 AI 发布新一代基座模型

? 阿里重磅开源多模态模型 Qwen2-VL

?️ 通义网页版上线 PPT 创作功能

? 众擎机器人完成天使轮融资,商汤领投

✍️ Codeium 完成 1.5 亿美元 C 轮融资

? 谷歌 Gemini 公布 5 种 Study Smarter 新方案

Runway AI 删除开源模型引关注

知名AI视频创新企业Runway在未提前通知的情况下,突然删除了其在 Hugging Face 和 GitHub 两大开源社区上的开源模型,引发业界广泛关注。此次删除行为涉及 Stable Diffusion v1.5 模型,该模型由 Runway、Stability AI 和慕尼黑大学共同研发。目前,Runway 官方尚未对此次删除行为作出任何公开回应,其社交平台上一切如常。

业界对Runway此举的原因有多种猜测,主要指向两个可能:一是与 Stability AI 之间的利益纠纷,二是涉及侵权问题,Runway可能在销毁证据。此前,Runway和Stability AI 在 Stable Diffusion 模型的开源发布上存在分歧,双方各执一词。此外,Runway、Stability AI 和其他几家AI公司曾因使用艺术家作品进行模型训练而面临集体诉讼。美国地区法院近期驳回了这些公司的上诉,允许艺术家进入列举证据的环节。Stable Diffusion 模型可能是这场诉讼的关键证据之一。

ChatGPT 全球周活用户破 2 亿

OpenAI 的 AI 聊天机器人目前周活跃用户数量已经超过 2 亿,短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中,92% 正在使用其产品;自 7 月份发布 GPT-4o mini 以来,其自动 API 的使用量已翻了一番。

首席执行官山姆・阿尔特曼(Sam Altman)在给该媒体的一份声明中表示:

人们正在使用我们的工具,将其融入到日常生活中,在医疗保健和教育等领域发挥着真正的作用,可以帮助完成日常任务、解决棘手问题,还是释放创造力。

Character.AI 上演 5% 裁员风波

据 The Information 报道,与谷歌达成重大交易不久后,美国人工智能创业公司 Character.AI 进行了至少 5% 的裁员,主要涉及营销和招聘岗位。在裁员前,Character.AI拥有约120名员工。

目前,Character.AI将由总法律顾问 Dom Perella 临时领导。Character.AI 的剩余领导层必须说服 100名左右的普通员工,在他们的原 CEO 以及不少加入谷歌的同事已经发财致富的情况下,跟着新的领导和新的任务继续坚持下去。这样 Character.AI 才有希望获得新的风险投资。

Character.AI 曾大谈特谈其闭环策略,即训练自己的大模型,将该模型用于聊天机器人,然后将用户使用数据用于训练中。而现在,Character.AI 将开始使用其他公司开发的开源模型,并转向后期训练。

智谱 AI 发布新一代基座模型

在 KDD2024 大会上,智谱 AI 发布了新一代基座模型,包括语言模型 GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型 GLM-4V-Plus、视频生成模型 CogVideoX 等,这些模型在相应领域均达到了国际第一梯队的水平。智谱AI还在「清言APP」上线了视频通话功能,并在 MaaS 平台上开放了 GLM-4-Flash API 的免费使用。

阿里重磅开源多模态模型 Qwen2-VL

阿里巴巴开源了最新视觉多模态模型 Qwen2-VL[1],根据测试数据显示,其 72B 模型在大部分指标超过了 OpenAI 的 GPT-c4o,Anthropic 的 Claude3.5-Sonnet 等著名闭源模型,成为目前最强多模态模型之一。Qwen2-VL 支持中文、英文、日文、韩文等众多语言,可以在 Apache 2.0 协议下进行商业化使用。同时阿里发布了 Qwen2-VL-72B 的 API,帮助开发者增强或开发多模态功能的生成式 AI 应用。

通义网页版上线 PPT 创作功能

通义网页版上线「PPT创作」功能,具备言之有物、设计精美、智能编排三大核心特点。PPT创作功能完全免费,基于通义大模型打造。在通义网页版,音视频转文字产品「通义听悟」升级为「实时记录」,长文档阅读助手「通义智文」升级为「阅读助手」,与「PPT创作」功能共同合并为通义效率,实现从信息搜集整理、内容理解再到内容创作的完整工作学习流。

众擎机器人完成天使轮融资,商汤领投

具身智能通用机器人研发商深圳市众擎机器人科技有限公司,完成天使轮及天使+轮共计近亿元的融资。两轮融资分别由商汤国香资本、弘晖基金领投,其他跟投方包括合肥滨湖金投和浔商资本等。

对于接下来公司的发展计划和动向,众擎机器人计划在今年第四季度推出多款全尺寸人形机器人,内部称为「SE系列」和「PM系列」,身高范围为 1.65 m-1.80 m。这些机器人将应用于工业和家庭场景,特别是在高危作业、生产制造和智能装配领域,涵盖汽车、电池、半导体等多个行业。

Codeium 完成 1.5 亿美元 C 轮融资

美国AI编程初创公司 Codeium 宣布,其已完成了 1.5 亿美元的 C 轮融资,本次融资由知名风投公司General Catalyst 领投。融资后,这家AI初创公司估值达到 12.5 亿美元,现已成功步入行业独角兽行列。

据悉,Codeium 由莫汉和他的儿时好友兼麻省理工学院校友道格拉斯·陈(Douglas Chen)创立于2021 年。Codeium 平台主要依托于在公共代码库中训练的生成式 AI 模型而运行。该平台支持约 70 种编程语言,并集成了许多流行的开发环境,其中包括 Microsoft Visual Studio 和 IDE。目前公司有 80 名员工,为在竞争激烈的市场中取得更大成功,他们打算在 2025 年前再招 40人。

谷歌 Gemini 公布 5 种 Study Smarter 新方案

随着新学年的开始,谷歌推出了一系列新功能,旨在通过其智能助手 Gemini 帮助学生更智慧地学习。无论你是刚步入大学校园的新生,还是准备迎接新挑战的返校生,Gemini 都准备好了帮助你更高效地学习。这五种方案包括:

利用权威教科书的提取知识:Gemini 可以从Rice 大学的教育非营利项目 OpenStax 提供的学术教科书中提取信息;

通过互动测验测试你的知识:Gemini 会逐个问题引导你,如果你在途中遇到困难,还会提供反馈和提示。

支持上传学习材料,像专业人士一样助力分析:使用 Gemini Advanced,可以一次上传多达10份文件——比如课程大纲或你的笔记——并要求 Gemini 解释内容或创建定制的学习指南。Gemini 将深入研究你的材料,分解关键概念,根据你的课程材料提供练习题等。

使用学习教练Gem获取个性化学习指导:Gemini Advanced 的订阅者可以访问 Gems,它们是任何主题的定制 AI 专家。预制的 Gem 学习教练可以帮助创建学习计划——包括进度检查,以确保你保持在正确的轨道上。

对任何主题推荐多媒体信息讲解:Gemini 可以以易于理解的方式分解信息。从视频到图像到针对你正在学习的内容量身定制的真实生活示例。

如果做好心理准备,一切准备都已经准备好了。

——威廉· 莎士比亚

编辑团队

编辑:Yuki

设计:Ivan

商务合作请加微信:Rwkfbcianvd

参考资料

[1]

Qwen2-VL: https://qwenlm.github.io/zh/blog/qwen2-vl/


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 人工智能 模型 开源 ChatGPT Runway Stability AI Character.AI 智谱 AI 阿里巴巴 通义 众擎机器人 Codeium 谷歌 Gemini
相关文章