参赛倒计时 | Gemma 开放模型微调挑战赛

原创 Google 2025-01-08 17:31 北京

挑战赛即将截止，与我们共同探索 Gemma 开放模型在多语言环境中的无限潜力。丰厚的奖金与独特的成长机会，期待您的参与！

挑战赛截至 2025 年 1 月 14 日。请抓住最后机遇，切勿错过截止时间。欢迎阅读本文，了解挑战赛的具体规则，期待看到您构建的精彩内容！

除非另有说明，否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。

概览

诚邀您参加本次 Gemma 开放模型微调挑战赛，希望您能针对特定语言或文化背景对 Gemma 2 进行微调。制作清晰易懂且易于操作的 Notebook 内容，不仅有助于帮助其他人学习，还可以促进开发者开发适用于不同社区的语言模型。

? Gemma 2

https://www.kaggle.com/models/google/gemma-2

说明

全世界有 7,000 多种语言和无数的文化差异，而 AI 具有促进全球理解的潜力。为了实现更广泛的语言包容性，我们特此举办 Kaggle 竞赛，重点面向 73 种符合条件的语言，鼓励开发者对 Google 的开放模型系列 Gemma 2 进行微调。这些语言的选择旨在代表多样化的范围，也可以让我们的评委小组能够从专业知识的角度进行有效的评估。我们对这些语言的初步关注将帮助我们建立强大的技术与资源基础，未来能够更好地支持资源匮乏的语言。

您需要在 Notebook 上记录微调 Gemma 2 的完整过程，包括：

数据集创建/管理：解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。

对 Gemma 进行微调：提供所用微调方法的详细说明，包括超参数选择、训练过程以及用于提高性能的任何技术 (例如，少样本提示、检索增强生成)。

推理和评估：演示如何使用经过微调的模型进行推理，并讨论您是如何评估模型性能的。

Notebook 里的内容应该设计为易于他人理解和复制，以便他们能够针对更多语言和文化背景来调整 Gemma 2。不妨考虑探索以下领域：

语言流畅性：微调 Gemma 以生成流畅准确的目标语言文本，应用于翻译、对话生成或故事讲述等任务。

文学传统：调整 Gemma 以生成或分析诗歌、民间传说或其他传统文学形式的内容。

历史文本：微调 Gemma 以理解和处理历史文献或手稿。

参赛者还需要在 Kaggle Models 上发布经过自己训练的模型。

准备好为更具包容性和更加互联的世界做出贡献了吗？立即参加 Gemma 开放模型微调挑战赛，帮助我们释放 AI 的语言潜力，惠及每一个人！

竞赛时间

2024 年 10 月 3 日 - 2025 年 1 月 14 日

竞赛截至 2025 年 1 月 14 日。请抓住最后机遇，切勿错过截止时间。期待看到您构建的精彩内容！

除非另有说明，否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。

奖励

第一名：30,000 美元

第二名：30,000 美元

第三名：30,000 美元

第四名：30,000 美元

第五名：30,000 美元

如果获奖者所在国家/地区的法律允许，我们还会为每个团队颁发一个实体奖杯。

提交说明

要参加 Gemma 开放模型微调挑战赛，您必须创建并分享一个公开的 Kaggle Notebook，该 Notebook 用于演示如何将 Gemma 模型用于各种语言和/或文化背景，并将您的模型变体发布到 Kaggle Models。您必须公开 Kaggle Notebook (以及任何基础数据源)，并应将其附加到官方竞赛数据集。所有团队成员必须在 Notebook 中列为协作者，并且必须通过 Google 表单提交 Notebook。我们将根据资格要求对所有提交内容进行初步评估，并根据评估细则对所有符合条件的参赛作品进行评分。我们将对您团队最新提交的内容进行评分。

? Gemma

https://www.kaggle.com/models/google/gemma-2

? Google 表单

https://link.gevents.cn/GemmaLanguageTuning

参加本次 Gemma 开放模型微调挑战赛，请填写此 Google 表单：

https://link.gevents.cn/GemmaLanguageTuning

提交参赛作品后，欢迎您在 "Android 开发者" 微信公众号后台留言，发送已提交作品的 Google 表单截图、Kaggle Notebook 链接以及竞赛报名的邮箱。审核后，我们将通过邮件与您联系，为您寄出一份 Google 定制精美礼品。

通用建议：

尽可能严格遵循指南，避免在规定范围之外进行操作。

清晰表述您做了什么、这样做的原因以及提交内容所属的类别。

尽可能让评分者能够轻松了解您的作品。

尽可能让评分者能够轻松了解为什么您的作品表现出色。

评估

资格要求

Notebook 内容应清晰易懂、记录详实且易于复制，以便他人能够理解作者使用的方法并加以借鉴。

成功报名参加竞赛的参赛者必须遵守以下要求：

创建详尽的 Notebook，演示如何有效地针对各种语言和/或文化背景对 Gemma 进行微调，包括有关数据集创建/管理、微调和推理的详细解释，如上文 "说明" 所述。

下面列出了 73 种符合条件的语言。

请注意，如果大小受限，您可以在 Kaggle Notebook 之外调整模型变体，前提是您需要在 Kaggle Notebook 中解释自己的方法是可复现的，并且您微调过的模型已发布到 Kaggle Models 上。

描述自己的数据集是如何创建的。

将自己的 Gemma 模型变体发布到 Kaggle Models。

提供运行模型推理的明确步骤。

合规：提交内容符合指南和说明。	[是/否]
贴合主题：提交内容与奖项类别相关。	[是/否]
开放：Notebook 和所有基础数据源均已公开。经过训练的模型已发布到 Kaggle Model Hub，并包含支持文档。	[是/否]
语言：所选语言是下方列出的符合条件的语言。	[是/否]

评估细则

技术性：该方法有效利用了少样本提示、检索增强生成和/或微调等策略。	[0-10 分]
描述性：详细描述了数据集的创建和/或管理。代码记录详尽，并且 Markdown 单元格既解释了代码，又提供了上下文。还清晰地解释了微调过程和推理步骤。	[0-10 分]
实用性：该方法产生的输出是有帮助或高质量的。	[0-10 分]
可靠性：当使用其他输入进行测试时，该方法的效果良好。	[0-10 分]

符合条件的语言

在本次竞赛中，有 73 种符合条件的语言，均是评委小组能够从专业角度进行验证和评估的语言。

竞赛官方网站

欢迎您查阅该竞赛的 Kaggle 官方网站，了解有关本次 Gemma 开放模型微调挑战赛的详细内容：

https://link.gevents.cn/GemmaLanguageTuning

推荐阅读

如页面未加载，请刷新重试

点击屏末 | 阅读原文 | 即刻报名参加 Gemma 开放模型微调挑战赛

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签