IT之家 04月15日 07:28
苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

苹果公司详细介绍了其在Apple Intelligence中采用的差分隐私和合成数据技术,以保护用户隐私。通过随机噪声算法,系统在生成Genmoji表情时,收集高频指令,同时脱离设备ID。对于长文本功能,苹果研发了专有合成数据方案,利用大语言模型生成虚拟邮件,转换为数字向量,并通过差分隐私技术匿名反馈。这些技术确保在不接触原始数据的情况下,优化模型训练,并已应用于邮件摘要等功能。苹果强调,所有模型训练均采用去标识化数据,个人数据加密存储在本地。

🛡️ 差分隐私技术:苹果利用差分隐私技术,通过随机噪声算法收集高频指令,例如生成Genmoji表情时的用户输入,同时确保数据与设备ID完全脱绑。这种机制能够优化多实体组合表情的生成准确率,且不触及IP地址等敏感信息。

📧 合成数据方案:针对邮件摘要等长文本功能,苹果研发了专有的合成数据方案。该方案首先由大语言模型批量生成虚拟邮件,并将其转换为包含主题、语言特征的数字向量。设备端随后计算真实邮件的向量,通过差分隐私匿名反馈最接近的合成向量类型,最终获得反映真实邮件分布规律的合成数据集,且不接触原始邮件内容。

🔒 隐私保护原则:苹果强调,Apple Intelligence所有模型训练均采用去标识化数据,并预先过滤社交安全号等敏感信息。即使在用户启用设备分析计划的情况下,其个人数据也始终加密存储在本地,公司仅获取经数学验证的群体趋势报告。

💡 技术应用扩展:差分隐私和合成数据技术将在即将发布的iOS 18.5等系统中扩展至Image Wand图像处理、记忆相册生成等十余项功能,进一步提升用户体验的同时,确保隐私安全。

IT之家 4 月 15 日消息,苹果公司昨日(4 月 14 日)发布博文,披露其 AI 隐私保护核心技术细节,重点介绍差分隐私和合成数据在 Apple Intelligence 中的应用。

差分隐私守护 AI 进化

以生成 Genmoji 表情为例,用户选择共享设备分析数据时,系统会通过随机噪声算法,收集高频指令(如“戴着牛仔帽的恐龙”),但不会记录频次过低的个性化指令,且所有数据与设备 ID 完全脱绑。

具体实现中,设备端会随机返回真实指令片段或干扰信号,只有某条指令被数百设备同时提交后,系统才会识别。这种机制已帮助优化多实体组合表情的生成准确率,且全程不触及 IP 地址等敏感信息。

合成数据破解长文本难题

面对邮件摘要等涉及长文本的功能,苹果研发了专有合成数据方案。首先由大语言模型批量生成虚拟邮件(如“明早 11:30 打网球吗?”),将其转换为包含主题、语言特征的数字向量(embedding)。IT之家附上苹果官方博文演示图如下:

参与计划的设备会在本地计算真实邮件的向量,通过差分隐私技术匿名反馈最接近的合成向量类型。经过多轮迭代,系统最终获得能反映真实邮件分布规律的合成数据集,但全程不接触原始邮件内容。目前该技术已在测试版邮件摘要功能中验证效果,未来还将应用于写作助手等场景。

隐私原则贯穿技术演进

苹果在博文中强调,Apple Intelligence 所有模型训练均采用去标识化数据,会预先过滤社交安全号等敏感信息。

即将发布的 iOS 18.5 等系统中,差分隐私和合成数据技术将扩展至 Image Wand 图像处理、记忆相册生成等十余项功能。苹果强调,即使用户启用设备分析计划,其个人数据也始终加密存储在本地,公司仅获取经数学验证的群体趋势报告。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

苹果 Apple Intelligence 差分隐私 合成数据 隐私保护
相关文章