



根据 Information,Meta 正计划在下周推出其即将发布的 Llama 3 的两个小版本,这些模型将作为今年夏天预期推出的 Llama 3 最大版本的先行者,发布这两个小型模型很可能会激发人们对即将推出的 Llama 3 的兴趣,该模型将在去年 7 月推出的 Llama 2 之后约 1 年推出。
Meta 希望 Llama 3 能赶上 OpenAI 的 GPT-4,后者能够基于用户上传到聊天机器人的图片回答问题。最大版本将是多模态的,这意味着它将能够理解和生成文本和图像。
根据 Meta 员工透露,下周将发布的两个小型模型不会是多模态的,较小的模型通常比较大的模型更便宜、运行速度更快,鉴于运行大型模型的成本,这使得它们变得越来越有价值。小型模型对于希望在移动设备上构建人工智能软件的开发者也很有价值。
Meta 此前发布了三个版本的 Llama 2,其中最大的拥有 700 亿个参数,参数是在训练过程中编码模型学习内容的设置。其他两个分别拥有 130 亿个参数和 70 亿个参数,预计 Llama 3 的大版本可能拥有超过 140 亿个参数。
近几个月来,Meta 内部的生成式 AI 部门的员工一直在努力使 Llama 3 在回答有争议的问题上更开放,此前 Meta 的领导认为 Llama 2 在其回答中过于保守。
Reference:
https://www.theinformation.com/articles/meta-platforms-to-launch-small-versions-of-llama-3-next-week?rc=z9mejq
Newin 行业交流群

2、微软和 AWS 赞助的 GenAI 旧金山峰会 2024 火热来袭!斯坦福大学李佳教授确认出席,早鸟优惠至 4 月 15 日,抓紧时间~ 报名方式请点击下方海报:
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。