原创 洪杉 2025-05-15 08:01 北京
5月AI最前沿(上)
提升人类科研效率,该AI上场了
五一期间,FutureHouse推出四个AI科研智能体,官方用四种动物来命名它们,分别是Crow(通用智能体)、Falcon(自动化文献综述智能体)、Owl(调研智能体)、Phoenix(实验智能体)。这些AI智能体可访问完整科学文献全文,还具备信息质量评估能力。
图源:FutureHouse官网
这其中,Crow、Falcon和Owl通过了严格的基准测试,在搜索精度和准确性上已经超越了o3-mini、GPT-4.5、Claude-3.7等当下顶级搜索模型。这三个模型可以访问大量完整的科学文本,这就意味着,你可以向它们提出关于实验方案和研究局限性的更详细的问题。它们还能使用各种因素来区分来源质量,确保它们不会依赖低质量的论文,或者是流行的科学来源。
图源:FutureHouse官网
目前这四个科学家智能体虽然还不能自主完成大多数科学研究,但是人类已经可以用它来生成和评估新的假设,规划新的实验——速度要比以前快很多。而且这些智能体的推理过程完全透明,对每个信息来源都进行了多阶段的深入分析。更重要的是,用户可以清晰地查看整个推理过程,了解智能体得出结论的每一步依据。
再加上FutureHouse平台本身就具备良好的扩展性,相信通过大规模整合和链接这些智能体,人类科学家能够大幅提升科学发现的速度与效率。
亚马逊推出触觉机器人,现已投入使用
近日,在德国 “Delivering the Future” 科技创新盛会上,亚马逊重磅推出全新仓储机器人系统 Vulcan,引发行业广泛关注。
图源:亚马逊
借助机器人学、工程学及物理AI领域的关键突破,它能达到人类般的触觉感知能力。其配备的力反馈传感器,能精准控制力度,如同人类般轻拿轻放,避免损坏商品;吸盘与摄像系统协同作业,吸盘抓取物品时,摄像机实时监测,确保取出的仅为目标物品,杜绝 “误取” 现象。
触觉AI有多牛?Vulcan的机械爪布满传感器,抓东西时会实时感知力度——比如拿一盒鸡蛋,它能自动调整到“刚好捏住不滑落,又不会捏碎”的微妙平衡点。更狠的是,它还能从失败中积累经验:第一次抓变形了包裹,第二次就会减轻20%的握力。
亚马逊内部测试显示,这种触觉+视觉的双保险,能让机器人处理仓库里75%的货物,包括以往只能靠人手的耳机充电盒、膨化食品袋等不规则物品。目前这款机器人已在德国汉堡仓库实测,成功把矿泉水箱的破损率从1.8%降到0.3%。
宠物沟通师真来了?百度公布动物语言转换专利
近期,百度申请了一项AI专利,该专利能够准确识别动物的情感状态,并将其转换为人类能够理解的语言,从而实现动物与人类之间更深层次的情感交流和理解。
百度在专利中介绍称,首先要获取与动物相关的多模态数据,包括动物的声音、行为和体征数据。然后,对这些多模态数据进行预处理,将其融合为统一的数据格式。通过分析融合后的数据,识别动物的当前情感状态,得出情感识别结果。最后,将情感识别结果进行语义映射和语言翻译,将动物语言转换为人类语言,形成语言转换结果。
这一创新或为跨物种交流开辟新途径,为未来人与动物深度交流提供新的可能性。
Gemini 2.5 Pro迎来重大更新
近期,Google DeepMind发布了Gemini 2.5 Pro的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在LMArena编程排行榜上名列第一,同时也在WebDev Arena排行榜上更是以显著优势超过了昔日霸主Claude 3.7 Sonnet!
现在用户只需使用一个提示词即可构建Web应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图+功能描述,就能得到一个带有自己设计的UI的功能完备的应用,大幅降低设计导向型开发者的入门门槛。
此外,Gemini 2.5 Pro (I/O edition) 还可以根据自然图像生成代码,而这些代码可以动态表示自然图像中内容。
100美元3D打印机械臂,AI机器人或将“平民化”
Hugging Face这家以同名AI开发者平台闻名的初创公司,正在销售一款可编程、可3D打印的机械臂SO-101,它能抓取和放置物体,并执行一些其他基本任务。
图源:Hugging Face官网
与之前发布的SO-100相比,SO-101组装速度更快,并且具有改进的电机,可以减少摩擦,同时使手臂能够承受自身重量。配备摄像头的手臂可以通过一种称为强化学习的人工智能技术进行训练,该技术使其能够“学习”执行诸如捡起乐高积木并将其精准放入垃圾箱等任务。
这一创新设计极大地拓宽了机械臂的应用场景,为教育、科研及小型制造业等领域提供了高性价比的自动化解决方案。
创意AI的下一代进化:Firefly Image Model 4系列模型
近日在Adobe MAX伦敦大会上,Adobe正式发布最新版Firefly,它将图像、视频、音频和矢量生成的AI工具整合为单个统一平台,图像真实度更高,还新增了生成视频功能,并引入多项新功能。
Firefly Image Model 4强调速度与操控性,被Adobe称为“迄今最快、最可控、最逼真的图像模型”,风格、尺寸和相机角度控制更加精准。
Firefly Image Model 4 Ultra则擅长处理“复杂场景与细小结构”,带来更高水平的细节与真实感。相比前代,这两款模型确保生成过程快速高效的同时,显著提升了图像质量。这两款模型目前已通过Firefly网页应用上线。
除了图像模型,Adobe还推出了Firefly Boards,这是一款类似FigJam的协作式AI情绪板工具,旨在为创意团队提供协作化、视觉化设计支持,目前处于公开测试阶段。
在模型兼容性方面,Firefly网页应用新增对第三方AI模型的支持,用户可选择GPT图像模型、Imagen 3及Veo 2模型进行图像和视频生成,未来还将支持Luma、Pika、Runway等模型。
更多AI前沿信息,点击视频了解
推荐阅读