Key Points
本周应用与模型
● Google将Gemini支持的新功能引入Chrome桌面版;
● Meta推出新工具AI Studio,允许用户定制AI聊天机器人;
● 生数科技自研视频大模型Vidu正式上线;
● 中国地震波大模型「谛听」发布,可以更快更准的识别地震信号。
本周应用
Google将Gemini支持的新功能引入Chrome桌面版
8月1日,Google表示将为Chrome桌面版推出由Gemini支持的新功能,包括「桌面版Lens」「标签比较」以及「自然语言历史记录搜索」。
Google Lens是Google开发的一项AI图像识别技术,它能够通过手机的摄像头实时识别拍摄的物品并提供相关信息。在移动设备上推出并不断改进多年后,该功能终于登陆桌面端。未来几天,该功能将向全球用户推出,并出现在地址栏和菜单栏中。用户可以点击地址栏中的照相机样式图标,截取画面或点击图片中的物体,Google将呈现相关搜索结果。框定所选物体后,用户还可以在右侧弹出的搜索界面中,进一步提出问题并获得AI回复。
「标签比较」是一款方便用户购物的新功能,它将不同页面的产品信息呈现在同一页面中,帮助用户跨网站对比产品参数和价格。未来几周内,该功能将首先在美国推出。
「自然语言历史记录搜索」指的是用户能够使用自然语言查询历史浏览记录,例如,「我上周看的那家冰淇淋店是什么?」Google使用URL、标题和页面内容的组合呈现搜索结果。
参考链接
https://blog.google/products/chrome/google-chrome-ai-features-august-2024-update/
Meta推出新工具AI Studio,允许用户定制AI聊天机器人
7月29日,Meta推出了一款名为AI Studio的新工具,允许用户创建、共享和设计个性化的AI聊天机器人。该工具基于Meta的Llama3.1构建,目前仅面向美国开放。
用户可以使用AI Studio中的模板或从零定制AI角色,具体操作包括自定义AI角色的名称、简介、头像、个性、能力、语气等。例如,一款名为「Eat like you live there!」的AI聊天机器人可以提供有关当地饮食的建议。定制好的AI角色可以仅为个人使用,也可以与粉丝、朋友分享,或是直接在Facebook、Instagram、Messenger和WhatsApp社交平台上公开。
Instagram创作者可以使用AI角色作为本人的「延伸」,快速回答常见的私信问题,回复Story中的粉丝提问,以吸引更多粉丝。创作者可自行决定是否启用AI回复以及AI回复的对象,AI回复的内容均设有标识。
参考链接
https://about.fb.com/news/2024/07/create-your-own-custom-ai-with-ai-studio/
生数科技自研视频大模型Vidu正式上线
7月30日,生数科技的视频大模型Vidu正式上线,面向全球用户开放文生视频和图生视频两大核心功能,可生成时长为4s或8s的视频,分辨率最高达1080P。Vidu新版本延续了「长时长、高一致性、高动态性」的特点,增加角色一致性、动漫风格、文字与特效画面生成等功能。目前无需申请,用户通过邮箱注册账号后即可使用Vidu。
生数科技由瑞莱智慧Real AI、蚂蚁集团和BV百度风投联合孵化,瑞莱智慧前副总裁唐家渝担任CEO,公司团队成员主要来自清华大学人工智能研究院。
参考链接
https://www.vidu.studio/
本周模型
中国地震波大模型「谛听」发布,可以更快更准地识别地震信号
7月28日,全球首个亿级参数量的地震波大模型「谛听」正式发布,「谛听」数据集也是现阶段规模最大、样本类型和标注最全的地震学专业AI训练数据集之一。「谛听」大模型由中国国家超级计算成都中心、中国地震局地球物理研究所、清华大学联合开发,亿级参数量级的版本已投入使用,十亿参数量级的版本预计今年8月完成预训练。「谛听」大模型的面世,标志着中国在地震监测、预警和前兆识别等关键环节具备更坚实的技术支撑。
2023年9月,中国国家超级计算成都中心与中国地震局地球物理研究所达成战略合作,双方共建「地震大模型创新应用联合实验室」,并与清华大学自动化系季向阳课题组、中国科学院地质与地球物理研究所的研究人员协同开展「谛听」地震波大模型的训练工作。
地震相关研究和应用主要基于地震观测数据,但传统方法和中小模型均无法充分利用百TB、千TB级别的地震观测数据。中国地震局地球物理研究所副所长陈石表示,「谛听」大模型依托中国地震观测网的海量数据,借助人工智能技术,大幅提升了地震信号的识别准确率和速度。未来,该模型的应用场景或涉及矿震监测、页岩气开采、城市地下空间结构探测、海底地震监测等多个领域。
参考链接
https://www.nscc-cd.cn/ch.html?chid=8aaa878b7568c9ad01756a5db4ac0024&childId=2c8d82f677facb6d0177fb25ffd70017&ctId=8aaa816b8f613d4a0190fd70f265003e