红杉汇 2024年12月16日
AI大家说|斯坦福大学报告:一些领域AI已领先于人类
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

斯坦福大学发布的《2024年AI指数报告》深入分析了AI领域的发展趋势与挑战。报告指出,AI在某些任务上已超越人类,但仍有不足;产业界在AI研究中占据主导地位;AI不仅提高了生产力,还提升了工作质量。同时,AI加速科学进步,全球对AI影响的关注日益增加。报告还强调了前沿AI研究以产业为主,基础模型数量倍增,开源比例显著提升。此外,AI专利数量激增,开源AI研究蓬勃发展,多模态AI成为重要趋势,人类评估也逐渐成为新趋势。经济方面,AI相关岗位缩减,但AI有效降低成本并提升收入,企业对AI的采用率也有所上升。

🚀AI能力发展:AI在图像分类、视觉推理和英语理解等任务中已超越人类,但在数学竞赛、视觉常识推理等方面仍有不足。这表明AI在特定领域取得了显著进展,但在更复杂、更需要人类认知能力的任务上仍需提升。

🏭产业主导研究:2023年产业界推出的机器学习模型数量远超学术界,且产业与学术联合推出的重要模型数量也创下新高。这反映了产业界在AI研究和应用方面的主导地位,以及产学研合作的重要性。

📈经济影响显著:AI在降低企业成本、提升收入方面表现突出,越来越多的企业在业务中应用AI技术。这表明AI正在对经济产生深远影响,并推动企业效率的提升和业务增长。

🤖机器人技术:机器人技术变得更加灵活,语言建模与机器人技术的结合催生了更具灵活性的机器人系统。这标志着机器人与现实世界交互能力的重大进步,也预示着机器人将在未来扮演更重要的角色。

🧩开源与合作:基础模型数量倍增,开源比例显著提升,开源AI研究蓬勃发展,这促进了AI技术的共享和进步,也为更多人参与AI研究提供了机会。

2024-12-16 08:01 北京

《2024年AI指数报告》出炉

近日,斯坦福大学发布了《2024年AI指数报告》。这份报告深入分析了当前AI领域的发展趋势和面临的挑战,揭示了AI技术如何影响我们的日常生活。我们截取了报告部分精华内容,与大家分享。


AI行业发展趋势概述


AI 在某些任务上已超越人类,但仍有不足

在图像分类、视觉推理和英语理解等基准测试中,AI已领先于人类,但在更复杂的任务如数学竞赛、视觉常识推理和规划方面,仍显劣势。




前沿AI研究依旧以产业为主

2023年,产业界推出了51个值得关注的机器学习模型,而学术界仅有15个。此外,产业与学术联合推出了21个重要模型,创下新高。







AI不仅提高了生产力,还提升了工作质量

2023年的多项研究表明,AI帮助员工更高效地完成任务,并显著提升了工作成果质量,同时缩小了不同技能水平员工之间的工作差距。




AI加速科学进步

AI在科学研究中的应用从2022年的初显端倪,而到了2023年,更是一举推出了多款重磅的科学相关AI应用。从大幅提升算法排序效率的AlphaDev,到加速材料发现进程的GNoME,这些AI工具极大地提高了科学发现的速度与效率。




全球对AI影响的关注与日俱增

益普索(Ipsos)的一项调查显示,在过去一年中,认为AI会在未来3至5年内对生活产生重大影响的人从60%增至66%。然而,与此同时,表达对AI产品和服务担忧的受访者比例也从2022年的39%飙升至52%。



研究与开发


前沿AI研究依旧以产业为主外,基础模型数量倍增,开源比例显著提升。2023年共发布了149个基础模型,是2022年的两倍多。其中,65.7%是开源模型,而这一比例在2022年为44.4%,2021年仅为33.3%。




前沿模型变得更加昂贵。根据估算,最先进的AI模型的训练成本已经达到了前所未有的水平。例如,OpenAI的GPT-4估计使用了价值7800万美元的计算资源进行训练,而谷歌的Gemini Ultra的计算成本则高达1.91亿美元。




AI专利数量激增。2021年至2022年,全球AI专利授权量大幅增长62.7%。自2010年以来,AI专利授权量增长了31倍多。



开源AI研究蓬勃发展。自2011年以来,GitHub上与AI相关的项目数量稳步增长,从2011年的845个跃升至2023年的约180万个,仅2023年就增长了59.3%。2023年,GitHub上AI相关项目的星标总数也显著增加,从2022年的40万个增至1220万个,增加了两倍多。


AI论文发表量也持续增加。2010至2022年间,AI相关论文总量从约88000篇增加至超过240000篇。



技术表现

除了前文提到的,AI在某些任务上已超越人类,但仍有不足外,多模态AI也是一个重要趋势。过去,AI系统往往局限于单一能力,例如语言模型擅长文本理解但在图像处理上表现不佳。然而,诸如Google的Gemini和OpenAI的GPT-4等多模态模型展示了强大的灵活性,不仅能够处理文本与图像,部分情况下还可以处理音频。




在ImageNet、SQuAD和SuperGLUE等经典基准测试上,AI表现已趋于饱和。2023年,研究者开发了更多具有挑战性的基准测试,包括SWE-bench(编程)、HEIM(图像生成)、MMMU(通用推理)、MoCa(道德推理)、AgentBench(代理行为)和 HaluEval(幻觉评估)等。




从模型表现来看,更好的AI依赖更好的数据。新一代AI模型如SegmentAnything和Skoltech开始被用于生成特定任务的专门数据,例如图像分割和3D重建。数据对于AI的技术改进至关重要。利用AI创建更多的数据可以增强当前模型的能力,并为未来的算法改进铺平道路,尤其是在难度较大的任务上。




此外,人类评估成为新趋势。随着生成式模型的文本和图像质量不断提高,基准测试逐渐向纳入人类评估的方向转变,例如Hugging Face上加入了人类偏好的对比排行Chatbot Arena Leaderboard,取代了过去以ImageNet或SQuAD为代表的机器评判排名。公众对AI的看法正日益成为追踪AI进展的重要考虑因素。




得益于语言模型,机器人技术变得更加灵活。语言建模与机器人技术的结合,催生了像PaLM-E和RT-2这样更具灵活性的机器人系统。这些模型不仅在机器人能力上有所提升,还能够主动提出问题,标志着机器人与现实世界交互能力的重大进步。




智能代理AI研究迎来更多突破。创建能够在特定环境中自主运行的AI代理系统,一直是计算机科学家面临的难题。然而,新兴研究表明,这些自主AI代理的表现越来越好。如今的代理AI已经能够精通Minecraft等复杂游戏,并高效完成在线购物、研究辅助等现实任务。




报告还指出,封闭式大语言模型显著优于开源模型。在10项选定的AI基准测试中,封闭模型的表现全面领先,表现中位数高出24.2%。这一性能差异对AI政策的讨论具有重要影响。




AI相关的经济趋势


AI 对经济的深度影响引发了诸多发人深省的问题。有人预测AI将推动生产力提升,但其影响到底有多深仍是个未知数。本章通过分析Lightcast、LinkedIn、Quid、麦肯锡、Stack Overflow和国际机器人联合会(IFR)等来源的数据,深入探讨了AI相关的经济趋势。


首先,AI相关岗位缩减,全球趋势同步。2022年,AI相关职位占美国总职位发布的2.0%,而这一比例在2023年下降至1.6%。AI职位发布数量减少的主要原因包括顶尖AI公司发布的职位数量下降,以及这些公司在技术岗位中的比例减少等。




其次,AI有效降低成本并提升收入。根据麦肯锡最新调查,42%的受访企业表示,通过应用AI(包括生成式 AI)有效降低了成本,同时有59%的企业表示收入实现了增长。与前一年相比,报告成本下降的企业比例增加了10个百分点,显示出AI正在显著推动业务效率的提升。




企业对AI的采用率有所上升。麦肯锡2023年的一份报告显示,目前有55%的企业在一个或多个业务单元或职能部门中应用了AI(包括生成式 AI)。这一比例高于2022年的50%,更是远超2017年的20%。




中国在工业机器人领域占据主导地位。自2013年超越日本成为工业机器人安装量最大的国家以来,中国与最接近的竞争国家之间的差距大幅扩大。2013年,中国的安装量占全球总量的20.8%,而到2022年,这一比例已上升至52.4%。




同时,机器人应用场景更加多元化。2017年,协作机器人仅占当年新增工业机器人安装量的2.8%,而到2022年,这一比例已攀升至9.9%。与此同时,2022年各类服务机器人的安装量也普遍增长,唯有医疗机器人领域例外。这一趋势不仅显示出机器人安装总量的整体上升,也反映出机器人正在更多地被部署到面向人类的服务角色中。




财富500强企业掀起了一股讨论AI的热潮,尤其是生成式AI。2023年,AI在394场财报电话会议中被提及,覆盖了近80%的财富500强企业,这一数字较2022年的266次显著增加。自2018年以来,AI在财富500强财报电话会议中的提及次数几乎翻了一番。其中,生成式AI是最热门的细分主题,在19.7%的电话会议中被提到。








推荐阅读




为目标而战的组织必备技能:随时打散,随时集结|红杉Library

早安 | 岁月漫长,愿你眼中常闪着好奇的光

创业者和职场人,都要学会反直觉思考 | 红杉汇内参

选择“Dream Offer”的关键因素|首席人才官

顶尖神经科学家推荐的21条大脑小窍门 | 红杉爱科学


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI指数报告 人工智能 机器学习 AI经济 开源AI
相关文章