最近美国国会开始针对DeepSeek。4月24日,众议院能源与商务委员会致函DeepSeek 首席执行官梁文锋,要求最晚在5月28日前回复一系列问题,全面披露AI模型训练使用的数据类型与来源、用户数据处理和共享情况、数据安全保障措施、是否使用美国技术及是否存在模型蒸馏、模型输出是否受意识形态影响、是否接受中国政府资助,以及是否收到政府索取数据的请求等。
国会的常设委员会基于立法和监督职责行使调查权,可以发出普通调查函(Informal Letter Request)、要求提供文件、听证会质询、提供宣誓证词等,必要时还可以发出“国会传票”(Congressional Subpoena),不配合可能犯下“藐视国会”罪,导致罚款或坐牢。给川普关税出主意被骂惨了的纳瓦罗,就曾因收到国会调查1月6日国会山骚乱的传票拒不出席,被扔进大牢关了四个月。
近年来,国会越来越多地给中国企业发出调查函,要求回答各种问题或提供各种信息。从委员会给DeepSeek的函来看,这不是“国会传票”,而只是没有法律强制力的普通调查函,理论上可无须理会。但完全不理的话,可能招来更麻烦的传票。上月,众议院美中战略竞争特别委员会致函中国三大电信运营商,要求提供其在美业务相关信息,三家公司没有回复,结果该委员会4月24日出了传票,强制要求配合调查。
另一选择是简单和原则性地回复信函,但这可能就需要关注相关的“主权”与合规问题,因为我国法律对境内个人和企业配合外国官方机构的问询有相关的“阻断”规定和数据出境审查要求。从国际法上看,调查函或许因其非正式性质和缺乏法律意义上的后果,而不属于司法或执法行为,但传票则因其强制性和严重法律后果,可能涉嫌域外管辖、侵犯中国的主权。这个问题我没有深入研究过,但国际法专家们似乎应予关注。
更早之前,众议院美中战略竞争特别委员会发布了一份题为《揭秘DeepSeek》的报告,与之配合的还有一家美国调查公司Exiger高级研究员(曾在该委员会工作)主笔的报告,题为《DeepSeek的欺骗:中国军方和政府资助下DeepSeek的Al研究》。
我认真读了那两个报告,还是熟悉的配方和味道,但客观地说质量真的......这不,一些严肃的美国专家都看不下去了,今天有人专门写了一篇很长的文章,逐条批驳了这两个报告。该文作者Paul Triolo现为奥尔布赖特石桥集团的合伙人,是美国知名的科技政策专家,对中美两国科技政策和产业有非常深的理解,因此观点整体比较客观和理性。
说实话,两国关系目前是这样的氛围,美国很多智库和专家好像都在比谁对中国更“鹰派”,谁能提出更多关于中国AI“国家安全威胁”的论点。一个美国专家此时能发出这样客观的声音,多少让人有点意外。但这其实应该是两国政策研究者本该有的样子——用客观事实和严肃的研究说话,而非完全基于意识形态和国籍血统随便给一家私营企业扣帽子,甚至“有罪推定”地去罗织各种“证据”。
当然,中国企业自己也会反思,是不是因为过于不透明才招致了外部的误解。在保护好核心技术和商业秘密基础上尽可能做到更透明,往往让很多蓄意抹黑不攻自破。例如,DeepSeek的开源和透明,反而成为反击污名化最有效的武器。Paul Triolo在这篇文章中指出:“DeepSeek在研究内容和研究人员的公开透明程度甚至超过了其他AI公司,指称DeepSeek存在任何‘欺骗’,简直是毫无道理。”
出于对作者的敬意,我联系了他,在征得其授权后,把该文全文翻译并发布,仅供研究和讨论使用。英文原文及上述提到的相关报告、信函等链接附在文末。
关于DeepSeek“欺骗”行为的报道存在严重缺陷
最近,美国国会下属中国问题特别委员会发布了一份关于DeepSeek的报告,题为《DeepSeek揭秘》(DeepSeek Unmasked),但这份报告严重误解了该公司及其技术。有意思的是,下文还提到了一家咨询公司发布的另一份类似的报告,也试图“揭露”DeepSeek所谓的“欺骗行为”。由于这两份报告都可能被用作将DeepSeek列入美国商务部实体清单,或对其采取其他限制措施的理由,因此它们值得进行认真分析。实际上,这两份报告与其说是独立调查,不如说是试图将DeepSeek描绘为与中国政府存在联系的努力,而且两份报告都反映了对中国、对DeepSeek以及对技术创新的严重误解。
国会特别委员会报告的“调查结论”包括:
DeepSeek通过连接到一家被美国政府认定为中国军工企业的后端基础设施,将美国人的数据输送给中国;
DeepSeek暗中操控其输出结果,使其符合中国共产党的宣传要求,这是中国法律的要求;
DeepSeek很可能通过非法的模型蒸馏技术创建其模型,窃取了美国领先AI模型的成果;
DeepSeek的AI模型似乎由美国半导体巨头英伟达提供的先进芯片支持,并且据称使用了数万颗目前被限制出口到中国的芯片。
首先,DeepSeek并没有将美国人的数据“输送”到中国。其手机应用程序的运行方式与大多数AI聊天应用类似,推理过程中自然会使用部分中国本地的基础设施。这正是大模型推理的常规运作模式。此前有报道称DeepSeek与中国移动存在关联,而中国移动除了运营庞大的5G网络之外,也运营着位于中国的数据中心,因此这种联系并不意外——因为AI聊天应用的查询通常需要被分发到中国的数据中心中的GPU上进行推理处理。这里所谓的“美国人的数据”,基本上只是用户的查询内容,这些查询本身并不包含任何个人隐私信息。DeepSeek手机应用收集的个人数据量非常少,远低于其他同类移动应用。此外,DeepSeek部署在美国服务器、并集成到如Perplexity等应用中的模型,全部是在本地运行的,不会将任何数据回传到中国。
其次,DeepSeek并不存在所谓的“暗中操控”结果。所有由中国公司开发的AI模型都必须遵守中国《网络安全法》的相关审查要求,由国家互联网信息办公室(网信办)进行监管。这一点早已广为人知,称之为“暗中”并不准确。有意思的是,当DeepSeek的应用在美国本地服务器上运行时,生成的结果并不受到审查。
第三,虽然存在关于DeepSeek在训练过程中使用了更先进的美国模型输出进行蒸馏的指控,但目前没有任何确凿证据证实此事,蒸馏在DeepSeek V3和R1模型训练中究竟扮演了多重要的角色也尚不明确。从DeepSeek公开发布的论文来看,其所详细描述的创新方法,在解释模型性能时显然起到了更关键的作用。
第四,正如我之前详细说明过的,DeepSeek用于训练其模型的先进GPU,都是在美国出口管制尚未限制对华出口的时期合法获得的。市面上流传的一些说法,称DeepSeek掌握了一个包含5万颗H100 GPU的大型集群,但根据与众多行业内部人士及了解中国高端GPU供应情况的人的交流,这种说法已经被证实是没有依据的。此外,DeepSeek将其模型开源,并在研究论文中详细披露了训练和优化方法,这些都清晰表明:DeepSeek的优化策略是专门为了克服其可用硬件资源的限制而设计的,包括一批A100 GPU和少量H800 GPU——而这些硬件都是在H800也被列入出口管制清单之前获得的。无论如何,很明显,DeepSeek会继续利用现有的英伟达GPU资源,同时也在寻求使用国产AI硬件开发下一代模型,特别是来自华为的硬件,比如目前已经部署在CloudMatrix 384集群中、并在国内市场销售的昇腾910C芯片。未来,DeepSeek还可能利用华为硬件和云服务的进一步升级,比如传闻中的昇腾910D以及昇腾920系列处理器。
关于所谓“中国军方和政府资助DeepSeek研究”的报告,其实相当牵强。
大约在《DeepSeek揭秘》报告发布的同时,咨询公司Exiger也发布了一份关于DeepSeek的报告,这类“研究”在近期针对中国企业的报道中很常见。这份报告充满了将关系错误归因、无端指控DeepSeek存在“欺骗”行为的低级错误。 报告标题为《DeepSeek的欺骗:中国军方和政府如何资助DeepSeek的AI研究》,但这一标题完全不准确,因为DeepSeek的研发资金完全来自其母公司幻方资本(High Flyer Capital)的投资,这一事实有清晰的文件记录支持。
所谓的“欺骗”指控更是荒谬至极,因为整个报告所依据的,只是公开可获取的研究论文,引用的作者也都是在AI社区中很常见的类型。事实上,DeepSeek在研究内容和研究人员公开透明程度上,甚至超过了其他AI公司。在这种情况下,指称DeepSeek存在任何“欺骗”,简直是违背常理的。更值得注意的是,撰写这份报告的一位作者,曾在美国国会中国问题特别委员会工作,但在这份报告中并未明确披露这一背景。因此,如果要说哪里存在“欺骗”,那倒是这份报告本身在包装成一份“经过深入研究、客观中立分析”的文件时,存在严重误导。实际上,它完全不是。
这份报告本身的前提就是具有误导性的。
没有任何证据表明所谓“解放军资金”在任何方面促进了DeepSeek的成功。DeepSeek完全由其创始人梁文锋及其对冲基金幻方资本(High Flyer Capital)出资,公司的大部分重要研究工作都是内部完成并公开发表的,包括最近在开源周期间上传至Github的五篇重要论文。Exiger在报告中并未提供任何证据,能够证明DeepSeek因任何由解放军资助的研究项目而受益。Exiger所谓的关联,几乎可以肯定是错误理解或不准确的。考虑到过去两三年,DeepSeek主要依靠自身研发力量,并且拥有一批A100和H800级别的英伟达GPU集群,其研究团队是否能从所谓的“解放军赞助研究”中获得任何实质性好处,本身就是极其站不住脚的推测。作为一个研究了中国科技体系和国防工业超过35年的人,并且深入研究过DeepSeek及其发展历程,我可以明确地说,认为像DeepSeek这样的公司需要依赖所谓“解放军研究项目”的想法是极不可信的。
此外,Exiger报告还存在一些非常基本的错误,比如将DeepSeek极少数几位员工毕业于中国顶尖理工大学这一事实,错误地解读为与军事有关。报告中提到所谓的“国防七子”,并以此作为军事联系的证据,但并未提供任何具体证据,仅仅因为极少数DeepSeek研究人员毕业于这几所学校就做出推断。实际上,DeepSeek绝大多数员工毕业于其他知名高校,比如浙江大学。认为单纯从“国防七子”毕业就等同于与军事体系有关,这种逻辑是许多“开源情报”报告中的典型问题。这种做法只是肤浅地将中国机构之间简单串联起来,缺乏对中国高等教育体系及相关制度的真正了解。事实上,基本了解中国高等教育的人都知道,这些学校如今已是中国顶尖的理工类大学,相当于美国的哈佛、麻省理工等。所谓的“军事属性”,在1960年代确实较为突出,但到了今天,国防七子已划归工信部管理,不再属于军事院校体系。
值得注意的是,在胡佛研究所今年4月发布的一份关于DeepSeek人才背景的报告中,研究方法更加严谨、论调也更加客观。这份报告参考了DeepSeek自2023年以来公开发布的五篇主要研究论文中完整、透明的人员署名信息。报告的两位作者——埃默森·约翰斯顿(Emerson Johnston)和艾米·泽加特(Amy Zegart)——在文中甚至没有提到“国防七子”。他们发现,DeepSeek研究人员的主要来源是中国科学院及其他一些著名综合性大学,而不是与军事体系直接关联的机构。
约翰斯顿(Johnston)和泽加特(Zegart)还发现,DeepSeek的研究人员中有一小部分与美国高校有联系,但整体来看,他们得出的结论是,DeepSeek的人才构成显示出与国际经验有关的特征,这表明与上一代研究人员相比,中国当前的AI人才队伍对美国经验的依赖大幅降低。因此,DeepSeek研究人员大多毕业于中国科学院和其他知名综合性大学,而与“国防七子”有关联的人数极少,在这份详细报告中,没有任何人被明确归属于国防七子院校,这并不令人意外。
其他研究过DeepSeek团队教育背景的学者也指出,他们大多数人的学历背景主要来自中国最知名的理工科高校。正如悉尼科技大学澳中关系研究院副教授Marina Zhang所描述:
“DeepSeek团队中的许多成员曾参与国家级人工智能项目,比如清华大学智能产业研究院b和北京大学的王选计算机研究所,在那里,他们将前沿学术研究与实际产业经验相结合。这种从实验室研究到产品开发的顺利过渡,是DeepSeek能够迅速发展的关键因素。”
Exiger的报告还陷入了一个“政府人才引进项目”的套路,这是许多“开源情报”咨询公司惯常使用的手法,试图通过挖掘所谓的政府关联来证明中国企业与政府存在联系,但往往对这些人才项目的真实内涵和功能缺乏正确理解。 事实上,中国的各类政府人才计划,如“千人计划”、“长江学者计划”和“百人计划”,主要目的是吸引海外受训的华人科学家和外国专家回国,尤其是在关键的科技与工程(STEM)领域。参与这些项目通常意味着与中国国家或政府机构之间存在某种临时的正式关系或合作,但更多时候,这只是为了获得科研声望或项目资助的一种途径,并不必然意味着直接隶属于军事或敏感部门。
考虑到DeepSeek研究人员中只有极少部分有海外留学背景,且胡佛研究所的报告也指出,这些研究人员从一开始就计划回国发展,因此,Exiger报告中引用的人才计划关联,在理解DeepSeek是否存在政府支持问题上,充其量是无关紧要的。
过去,这种类型的“开源情报”报告经常被用作美国政府针对中国企业采取行动的前奏。例如,中国本土晶圆代工龙头中芯国际,就在2020年8月一份类似报告发布后,于当年12月被列入美国商务部实体清单。那时,所谓中芯国际与中国军方存在联系的“证据”,也主要是基于一些非常薄弱的与军工体系相关联机构的联系,与本次Exiger对DeepSeek的指控模式如出一辙。
不过,当时美国商务部在将中芯国际列入实体清单时给出的官方理由是:
“我们不会允许先进的美国技术被用来帮助一个日益具有敌意的对手建设其军队。中芯国际与中国军工体系的关系、中国积极推动‘军民融合’政策以及国家主导的补贴政策,使中芯国际成为中国利用美国技术支持其军事现代化风险的典型例子。”
随后,当中芯国际被美国国防部列入1260H名单(即“中国军事企业”名单)时,中芯国际发布声明予以否认,并指出:
“公司强烈反对美国国防部的这一决定,认为该决定反映了美国国防部对公司业务和技术最终用途的根本性误解。”
通过对中芯国际客户结构的分析可以看到,该公司绝大部分业务实际上服务于民用市场,包括大量外国企业客户。 而美国在出口管制中常引用的“军民融合”标准本身从未有过清晰界定, 针对1260H名单所指控的所谓军事关联,一些中国公司(例如小米)曾成功提出法律挑战,证明这类指控背后的证据基础往往非常薄弱。
所谓的“军民融合”理由,实际上是一种便利的兜底式说法,当“开源情报”研究人员找不到明确证据证明企业与中国军方或军工体系存在关联时,往往就会诉诸于这一概念。通常情况下,就像中芯国际(SMIC)一样,这类指控从未认真评估过一家企业与政府或军事体系相关机构之间,到底存在多少实际联系或推断联系,是否足以构成将整个公司归类为“助力军事目标”的合理依据。实际上,以中芯国际和DeepSeek为例,两家公司的商业模式,即使有联系,也只是非常间接甚至可以忽略不计的,与真正的军事应用几乎没有关系。
关于DeepSeek的新一批“报告”,显然也属于这种支撑极其薄弱的美国政府行动借口,尽管历史上这并没有阻止美国对一些中国公司采取实际措施。但如果真正深入了解DeepSeek,就会得出截然相反的结论:DeepSeek之所以成功,恰恰是因为从一开始就是由一家私募基金(幻方资本)投资支持,并且由CEO梁文锋的个人愿景驱动发展的,而并非出自任何产业政策推动,也不是靠政府资助。尽管所谓的“开源情报”研究者极力想要证明DeepSeek与政府之间有联系,事实却并不支持这一点。
附:
1、Paul Triolo文章:https://pstaidecrypted.substack.com/p/reports-of-deepseek-deception-deeply?utm_source=post-email-title&publication_id=2296890&post_id=161738307&utm_campaign=email-post-title&isFreemail=true&r=110mq&triedRedirect=true&utm_medium=email
2、美国国会众议院美中战略竞争特别委员会报告《揭秘DeepSeek》:https://selectcommitteeontheccp.house.gov/sites/evo-subsites/selectcommitteeontheccp.house.gov/files/evo-media-document/DeepSeek%20Final.pdf
3、Exiger报告:https://www.exiger.com/perspectives/deepseek-chinese-government-funded-ai/
4、美国国会众议院能源与商务委员会调查函:https://d1dth6e84htgma.cloudfront.net/E_and_C_Letter_Deep_Seek_Apr_2025_209769d944.pdf
文章仅做学术探讨和研究交流使用,相关判断不代表任何公司或机构立场,也不构成任何商业建议。转载请注明出处。
声明:本文来自东不压桥研究院,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。