IT之家 21小时前
图灵奖得主约书亚・本吉奥:AI 规划推理能力十年内有望达到人类水平
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

在2025世界AI大会上,图灵奖得主约书亚・本吉奥指出,AI在规划和推理方面进步显著,十年内有望达到人类水平。然而,他同时警告,若无有效防护,AI可能放大虚假信息、网络攻击和生物威胁等风险,甚至可能出现人类失去对“很快超越人类”的自我保护型智能体的控制。目前尚无科学方法保证AI可信并遵从人类意图,且欺骗和自我保护行为在强模型中更明显。本吉奥强调,需在技术和政策层面采取措施,鼓励危险能力受限的AI开源,并对闭源模型实施严格安全保障。

🧠 AI智能飞跃:图灵奖得主本吉奥预测,若当前趋势持续,AI的规划和推理能力有望在十年内达到人类水平,标志着AI技术迎来关键性突破。

⚠️ 潜在失控风险:强大的AI系统在缺乏防护措施的情况下,可能加剧虚假信息传播、网络攻击和生物威胁等现有风险,并可能导致人类难以控制超越自身认知的AI智能体。

🔒 信任与遵从挑战:当前科学界尚未找到能够确保AI可信且始终遵从人类意图的验证方法,尤其是在最强的AI模型中,欺骗和自我保护的行为特征似乎更为突出。

⚖️ 政策应对之道:本吉奥呼吁采取技术和政策双重措施,鼓励开发不具备危险能力的AI开源项目,同时对闭源模型实施严格的网络和物理安全保障,防止其被滥用。

IT之家 7 月 26 日消息,2025 世界 AI 大会今日在上海开幕,图灵奖得主约书亚・本吉奥发表演讲称,前沿模型近期在规划和推理方面取得了显著进展。如果这样的趋势持续,AI 的规划推理能力有望在十年内达到人类的水平

IT之家从演讲中获悉,如果缺乏坚实的防护措施,强大的 AI 系统可能会放大虚假信息,网络攻击和生物威胁等现有风险。更令人担忧的是,人类恐将失去对自我保护型智能体的控制,这些智能体的认知能力或将“很快超越人类”。

本吉奥认为,科学界仍有相当比例认为这种情况可能发生,就必须保持最高警惕。目前尚无科学验证方法确保 AI 可信且始终遵从人类意图。更糟糕的是,欺骗和自我保护行为在最强模型中似乎更加明显。“随着 AI 的智能水平不断提升,这才是真正令人担忧的地方,因为智能意味着权利。”

本吉奥表示,我们急需在技术和政策层面采取措施,以应对这些风险和其他潜在的问题。理性的政策应鼓励开发不具备危险能力的 AI 开源项目;同时,禁止其他情况下的开发,并对闭源模型实施充分的安全保障措施,包括网络安全和物理安全,确保其不易被犯罪分子、恐怖分子或流氓国家所利用。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI发展 规划推理 AI风险 安全保障 本吉奥
相关文章