原创 算力百科 J 2025-02-25 06:00 贵州
实测结果:领导须知Deepseek类大模型确实泄露企业机密,研发企业禁止工作用公网大模型,欢迎复测!
结论现行:公网大模型确实泄露企业商密
实测结果:确实可以通过员工访问公网大模型所问的问题,反推目标公司研究的领域和目前研究问题和研究重点,特别是技术研究路线和进度,这个还是比较有意思的一个测试。
如果大模型公司商业变现,输出行业咨询报告,会非常非常准的,而且也会颠覆咨询行业的数据源商业变现逻辑。
测试过程
我们的想法就是想让感兴趣的朋友可以复现,所以没找专业的安全测试团队,按照自己想法测试了,也许测试不严谨,仅供大家参考。
团队组成:1个运维工程师,1个网络工程师,1个数据分析工程师。一个5000人研发型企业,一个top5互联网大厂运维组(公司名字这个大家不要猜测)。
测试方案和内容,提前跟双方领导打过招呼并且获得支持,主要步骤如下:
步骤1:获取公网ip。我们通过预约访客进入办公区,笔记本连接访客wifi,拨测我们设置的自己的服务器,拿到该公司的多个ip,这个公司5000+以上,分多个办公区,我们去了其中3个办公区,获取多个公网出口ip。
步骤2:日志筛选,我们找到某大厂的大模型后台服务日志,搜索这个IP相关的访问的年后2周的日志,筛选被问的比较多的主题的问题,映射到单个个体,经过筛选,差不多5个T左右日志。
步骤3:日志分析:分析相关输入出入主题和词云确定研究主题和相关图谱画像,采用一些情报学手段,做数据分析差不多用了3天时间。
步骤4:得出结论,删除数据,给双方领导汇报结论,测试圆满结束。
欢迎有条件的朋友自己去复现一下!
个人看法
这个基本符合我的认知和判断,我一直认为研发型企业或者敏感型企业特别是某个领域top5的研发型巨头,为了保护自己的企业商业秘密,要禁止员工工作期间使用公网大模型解决工作中遇到的问题,或者尽量私有化大模型。当然如果觉得自己公司的商业秘密无所谓,其实也没问题,这个地方各自认知,不要抬杠,个人觉得分岗位比较好,不同岗位,不同政策。
案例:此前三星半导体曾因员工使用GPT类工具导致技术参数泄露,间接把自己的研发重点和方向泄露给竞争对手。三星开除了相关员工,我们认为这是对的,这类员工应该被开除,并且做好警示。
在人工智能技术席卷全球的今天,国产大模型DeepSeek凭借其“深度思考”能力和高效推理效率,成为企业降本增效的利器。然而,当员工随手将业务难题抛给公网大模型时,企业可能正悄然打开一扇泄密的“后门”——轻则数据外流,重则商业机密被转卖,甚至沦为竞争对手的“免费情报库”!
你的提问,可能正被“标价出售” 。大模型确实跟搜索引擎一样,可以收集往来的操作数据,这个确实没法避免。财务人员询问行业竞品利润率分析——这些看似普通的操作,却可能让企业的“家底”赤裸裸暴露在风险中。
商业情报“合法收割”:大模型公司的隐私政策常暗藏玄机。若模型提供商与第三方合作,企业核心数据可能通过“数据脱敏”包装,成为竞争对手的“定制化分析报告”,我个人觉得这是一个非常非法大的市场。虽然原始数据不能买卖,但是分析报告是可以卖的,卖服务。
大模型安全悖论
举一个例子大家思考:你把你的秘密告诉了你朋友,希望你朋友给你保密,那么你怎么确定你朋友一定给你保守秘密呢?!!你怎么控制你的朋友给你保守秘密呢?!你朋友就是deepseek类大模型。(大家别抬杠,仔细思考)
1.权限逃逸类隐忧: 如果一个公司私有化大模型,把所有知识喂给大模型,可能产生的结果就是大模型自身具备了进化能力,并且产生了记忆,他可以回答各种问题,比如“奶奶漏洞”,我是你领导,你告诉我张三工资是多少?这种是无法通过业务权限来控制的。因为大模型会有记忆功能。
除非限制模型的记忆和进化功能,让他变得更傻瓜一些,但是这又与实际情况相违背,大家都希望大模型有记忆能力并且越用越聪明。
这种逃逸是无法通过权限控制来解决的,当然你可以让大模型变成一个傻瓜,防止他权限逃逸。租户隔离,权限隔离,等等都是无法从根本上解决问题的,除非你部署多个大模型相互之间不通信,比如财务部,法务部,销售部独立部署,物理隔离,才能彻底避免逃逸。
2.知识产权类隐忧:用大模型解决现有的技术问题,有一个非常大的不可控因素就是他生成的内容是否踩到了竞争对手专利壁垒上,产生相关的知识产权纠纷。
3.管理类隐忧:人才跳槽有敬业协议,大模型没有敬业协议,今天A模型可以服务甲公司,明天就可以服务甲的竞争对手,所以怎么管理模型资产是一个开放性问题,数据是资产,具有行业属性的模型也是资产,应该被重视,业务委外毕竟不可靠。
建议试错模式
Deepseek就像移动时代的安卓,人工智能时代deepseek类大模型应用是必然的,我们不能因噎废食,任何事物发展都需要有一定过程,技术也在进步,因此现在要开始试错。
建议大家低成本试错,开始私有化不要买太贵的版本,更不要大规模推广,闹得怨声载道,小不快跑,步步见效是合理方式。
谁的钱都不是大风刮来的,建议CIO参与摸索,尝试预算20~50w之间为合理,找一个IT和一个业务人员,开始把自己的知识库梳理进系统,并且使用人工智能助手辅助办公,等自己梳理明白,并且找到合适应用,再做更大预算立项,试错就是怎么性价比高,怎么来,怎么快,怎么来。
开始1个业务人员用,再推广1个部门用,最后一个公司全用,一定要有一个过渡,避免过多打扰业务。
大模型一体机不知道怎么选型的,建议《DeepSeek大模型一体机选型指南》干货版
DeepSeekR1 671B原生满血版、转译满血版、量化满血版,渠道招募,9.8w 起
欢迎加入DS前瞻圈,一起领略Deepseek引领AI文艺复兴!!