2025-06-16 15:39 江苏
距离特朗普政府启动联邦政府AI发展计划已经不到一个月,而计划所依托的一套代码库却在GitHub上遭意外泄露,并在下线前被不少目光敏锐的观察者所发现。
整理 | 褚杏娟 核子可乐
距离特朗普政府启动联邦政府 AI 发展计划已经不到一个月,而计划所依托的一套代码库却在 GitHub 上遭意外泄露,并在下线前被不少目光敏锐的观察者所发现。
泄露的信息核心是“AI.gov”项目:AI.gov 将成为政府机构在运营流程中引入 AI 的枢纽,由美国总务管理局(GSA)与技术转型服务局(TTS)小组,在 Thomas Shedd 的领导下合作开发。
泄露事件被曝光没多久,该代码仓库就从 GitHub 上消失了。不过有网友称,虽然 ai.gov 的 GitHub 代码仓库似乎不再显示,但也并没有完全隐藏——总务管理局方面只是把它移到了一大堆归档项目当中。有兴趣的读者朋友可以查看:https://github.com/gsa-tts-archived/ai.gov
泄露了哪些信息
从泄露的代码仓库信息来看技术转型服务小组负责人、马斯克的盟友 Thomas Shedd 在今年 1 月底接掌团队时就曾提出这一设想。
Shedd 的职业生涯主要是在特斯拉担任软件集成工程经理,之后被任命为技术转型服务负责人。他加入政府之初就将 AI 放在了首位。据报道,他希望总务管理局能够像初创软件公司那样运营,并提出了一项涵盖全政府且 AI 优先的战略,希望将目前联邦雇员的大部分工作转为自动化。
根据 GitHub 上托管的 AI.gov 网站暂存链接,Shedd 的任务将于 7 月 4 日正式启动——从现已隐藏的 GitHub 页面内相关问题帖判断,这也将是该网站的正式上线日期。值得注意的是,7 月 4 日也是美国独立日。
据开发者介绍,AI.gov 的计划上线日期为 7 月 4 日
从 ai.gov 基础阶段的实施来看,该项目共包含三大组件:
一款可以执行某些操作的聊天机器人;
一个“一体化 API”,允许各政府部门将其系统接入至 OpenAI、谷歌以及 Anthropic 模型;
一款名为“CONSOLE”的方案,页面将其描述为“分析机构整体实施情况的突破性工具”,CONSOLE 将允许各机构实时监控其内部的 AI 使用情况,以了解员工如何使用工具以及他们更喜欢哪些工具。
网站内容显示,总务管理局正与获得 FedRAMP 认证的供应商合作。根据 GitHub 页面上的 API 文档,AI.gov 将通过 Amazon Bedrock 提供 AI 模型,API 文档中列出的大部分模型均已获得 FedRAMP 认证,可供政府部门使用。此外,还可以看到,API 文档中还出现了企业级 AI 厂商 Cohere 的一款模型,而 Cohere 似乎并未获得 FedRAMP 认证。
根据 API 文档,AI.gov 网站将会推送部分 AI 模型列表
GitHub 文档还提到,该网站将发布大模型排名,但目前还不清楚具体排序标准。
政府决策靠 AI?
“他们的无能程度令人难以置信。”有网友愤怒地表示。
此次泄漏事件引发了人们对公共部门过度使用 AI 的不满。
“我在一家严重依赖人工智能的公司工作。每周都会有人多次找我,去解决他们因为盲目遵循大模型指示而搞砸的事情,这让我很震惊。”有网友在看到泄露消息后说道,可以看出其对 AI 处理工作的不信任。
联邦政府最近正大力宣传对 AI 技术的应用。相较于拜登政府,特朗普政府对 AI 的监管更加宽松,并试图取消各州一级监管,同时加大了对本土 AI 厂商的支持。
此外,特朗普政府及 DOGE 效率部积极推动 AI 应用,政府部门也越来越多采用 AI 来取代在大规模裁员中被裁撤的人手,甚至开始依靠 AI 进行关键决策。尽管马斯克最近离开了政府,并与特朗普“撕”了一场,但 AI.gov 项目表明,DOGE 的影响力仍在延续。然而,大力推行 AI 的 DOGE 此前在使用 AI 处理政府事务时就被公众质疑。
今年在特朗普政府准备取消退伍军人事务部(VA)的一些合同时,DOGE 团队里,直接让没有任何医疗或政府经验的软件工程师 Sahil Lavingia 开发了一个 AI 工具,用来识别哪些来自私营公司的服务是“非必要”的,这些合同会被标记为 “MUNCHABLE”。
使用结果就是错误百出。它会臆造合同金额、经常错误读取甚至夸大合同价值。比如,大模型认定有超过一千份合同的金额为 3400 万美元,而实际上其中有些合同仅值 3.5 万美元。
该 AI 工具最终将 2000 多份合同列为“MUNCHABLE”。外媒 ProPublica 从知情人士手中获得了这段 AI 代码及其标记的合同清单,并找了六位 AI 与政府采购方面的专家进行评价。所有专家一致认为该脚本存在严重缺陷。
专家表示,代码中出现的至少部分错误,是由于使用的 OpenAI 模型版本过旧,这些模型不具备处理复杂任务的能力。更严重的是,这个工具背后的指令本身就存在重大缺陷。记录显示,Lavingia 让 AI 系统只依据每份合同前几页的内容(大约 2500 个词)做出复杂判断,而这些内容往往只是概括性的摘要。
Lavingia 表示自己在入职第二天就完成了该工具的第一个版本,并使用 AI 辅助编写代码。他在 DOGE 工作了近两个月,本人也承认代码存在缺陷。“我可以肯定地说,确实有错误出现了。总是会有错误的。我绝不会建议任何人直接运行我的代码并照做。就像美剧《办公室》那一集,Steve Carell 因为谷歌地图指示要‘开进湖里’,他就真开进去了。‘不要开进湖里’。”
当时,许多人批评使用 AI 来主导 VA 预算削减的做法。“AI 完全不适合做这类事,”曾在奥巴马政府担任财政部 IT 合同监管员的 Waldo Jaquith 表示, “AI 经常会给出看起来很有说服力但其实错误的答案。这种工作必须由人来完成。”
据悉,今年 2 月,在 404 Media 获得了一段泄露的会议录音中,Shedd 告诉他的团队,他们将开发“AI 编码代理”,为整个政府编写软件,并表示他希望利用 AI 来分析政府合同。当时受访的一些政府雇员表示,Shedd 的计划在内部遭到“几乎一致反对”,彼时指出的多种可能出现的问题后来在实行中也出现了。
此外,公众担心的另一个问题是:“把一堆数据整合打包在一起,难道不会让黑客攻击的破坏性更大吗?”有网友列举了除此次泄露事件之外的其他案例: