IT之家 01月15日
为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta内部文件曝光,显示其在开发Llama 3时,将超越OpenAI的GPT-4视为核心目标,并展现出强烈的竞争意识。高管们将Anthropic的Claude和OpenAI的GPT-4视为行业标杆,并力求超越。尽管Meta以开源AI模型著称,但内部更关注如何超越闭源模型。为获取训练数据,Meta采取了“非常激进”的策略,甚至讨论使用包含受版权保护作品的数据集。Meta CEO扎克伯格也强调要缩小Llama模型与竞争对手的差距,并期望未来的Llama模型成为行业领先者。然而,这种激进策略也引发了法律问题,Meta正面临多起关于数据版权的诉讼。

🎯Meta 在开发 Llama 3 时,明确将超越 OpenAI 的 GPT-4 作为核心目标,并在内部沟通中展现出强烈的竞争意识。

🏆Meta 内部将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为行业标杆,并以此为目标努力,力求在性能上超越这些竞争对手。

📚为获取训练 Llama 模型所需数据,Meta 采取了“非常激进”的策略,甚至讨论使用包含受版权保护作品的数据集,这引发了法律诉讼。

🚀Meta CEO 扎克伯格强调要缩小 Llama 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距,并期望未来的 Llama 模型能成为行业领导者。

IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。

Meta 生成式 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月发给研究员 Hugo Touvron 的消息中表示:“说实话…… 我们的目标必须是 GPT-4。我们即将拥有 64,000 个 GPU!我们必须学会如何构建前沿技术并赢得这场竞赛。”

尽管 Meta 一直以开源 AI 模型著称,但其 AI 团队显然更关注如何超越那些不公开模型权重的竞争对手,例如 Anthropic 和 OpenAI。Meta 的高管和研究人员将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为行业标杆,并以此为目标努力。

在内部讨论中,Meta 对法国 AI 初创公司 Mistral 的态度显得不屑一顾。Mistral 是 Meta 在开源领域的主要竞争对手之一,但 Al-Dahle 在消息中直言:“Mistral 对我们来说不值一提。我们应该能做得更好。”

当前,科技公司正竞相推出尖端 AI 模型,而 Meta 的内部通信进一步揭示了其 AI 领导层的高度竞争心态。在多次交流中,Meta 的 AI 负责人提到,他们在获取训练 Llama 模型所需数据时表现得“非常激进”。一位高管甚至在一封内部邮件中表示:“Llama 3 几乎是我唯一关心的事情。”

然而,这种激进的竞争策略也引发了法律问题。本案检察官指控 Meta 高管在匆忙推出 AI 模型的过程中,存在使用受版权保护的书籍进行训练的行为。Touvron 在一份消息中指出,用于训练 Llama 2 的数据集“质量不佳”,并讨论了如何通过优化数据源来提升 Llama 3 的表现。随后,Touvron 和 Al-Dahle 讨论了使用 LibGen 数据集的可能性,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的受版权保护作品。Al-Dahle 在消息中问道:“我们是否有合适的数据集?有没有什么数据是你想用却因为某些愚蠢的原因无法使用的?”

IT之家注意到,Meta 首席执行官马克・扎克伯格此前曾表示,他正致力于缩小 Llama 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距。内部消息显示,公司内部为实现这一目标承受了巨大压力。扎克伯格在 2024 年 7 月的一封信中写道:“今年,Llama 3 已经能够与最先进的模型竞争,并在某些领域处于领先地位。从明年开始,我们预计未来的 Llama 模型将成为行业中最先进的。”

2024 年 4 月,Meta 正式发布了 Llama 3。这款开源 AI 模型在性能上与谷歌、OpenAI 和 Anthropic 的闭源模型不相上下,并超越了 Mistral 的开源模型。然而,Meta 用于训练模型的数据 —— 尽管扎克伯格据称批准使用这些数据,但其版权状态存疑,正在多起诉讼中面临审查。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta Llama 3 人工智能 GPT-4 数据版权
相关文章