原创 Google 2025-01-08 17:31 北京
挑战赛即将截止,与我们共同探索 Gemma 开放模型在多语言环境中的无限潜力。丰厚的奖金与独特的成长机会,期待您的参与!
挑战赛截至 2025 年 1 月 14 日。请抓住最后机遇,切勿错过截止时间。欢迎阅读本文,了解挑战赛的具体规则,期待看到您构建的精彩内容!
除非另有说明,否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。
概览
诚邀您参加本次 Gemma 开放模型微调挑战赛,希望您能针对特定语言或文化背景对 Gemma 2 进行微调。制作清晰易懂且易于操作的 Notebook 内容,不仅有助于帮助其他人学习,还可以促进开发者开发适用于不同社区的语言模型。
? Gemma 2
https://www.kaggle.com/models/google/gemma-2
说明
全世界有 7,000 多种语言和无数的文化差异,而 AI 具有促进全球理解的潜力。为了实现更广泛的语言包容性,我们特此举办 Kaggle 竞赛,重点面向 73 种符合条件的语言,鼓励开发者对 Google 的开放模型系列 Gemma 2 进行微调。这些语言的选择旨在代表多样化的范围,也可以让我们的评委小组能够从专业知识的角度进行有效的评估。我们对这些语言的初步关注将帮助我们建立强大的技术与资源基础,未来能够更好地支持资源匮乏的语言。
您需要在 Notebook 上记录微调 Gemma 2 的完整过程,包括:
数据集创建/管理:解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。
对 Gemma 进行微调:提供所用微调方法的详细说明,包括超参数选择、训练过程以及用于提高性能的任何技术 (例如,少样本提示、检索增强生成)。
推理和评估:演示如何使用经过微调的模型进行推理,并讨论您是如何评估模型性能的。
Notebook 里的内容应该设计为易于他人理解和复制,以便他们能够针对更多语言和文化背景来调整 Gemma 2。不妨考虑探索以下领域:
语言流畅性:微调 Gemma 以生成流畅准确的目标语言文本,应用于翻译、对话生成或故事讲述等任务。
文学传统:调整 Gemma 以生成或分析诗歌、民间传说或其他传统文学形式的内容。
历史文本:微调 Gemma 以理解和处理历史文献或手稿。
参赛者还需要在 Kaggle Models 上发布经过自己训练的模型。
准备好为更具包容性和更加互联的世界做出贡献了吗?立即参加 Gemma 开放模型微调挑战赛,帮助我们释放 AI 的语言潜力,惠及每一个人!
竞赛时间
2024 年 10 月 3 日 - 2025 年 1 月 14 日
竞赛截至 2025 年 1 月 14 日。请抓住最后机遇,切勿错过截止时间。期待看到您构建的精彩内容!
除非另有说明,否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。
奖励
第一名:30,000 美元
第二名:30,000 美元
第三名:30,000 美元
第四名:30,000 美元
第五名:30,000 美元
如果获奖者所在国家/地区的法律允许,我们还会为每个团队颁发一个实体奖杯。
提交说明
要参加 Gemma 开放模型微调挑战赛,您必须创建并分享一个公开的 Kaggle Notebook,该 Notebook 用于演示如何将 Gemma 模型用于各种语言和/或文化背景,并将您的模型变体发布到 Kaggle Models。您必须公开 Kaggle Notebook (以及任何基础数据源),并应将其附加到官方竞赛数据集。所有团队成员必须在 Notebook 中列为协作者,并且必须通过 Google 表单提交 Notebook。我们将根据资格要求对所有提交内容进行初步评估,并根据评估细则对所有符合条件的参赛作品进行评分。我们将对您团队最新提交的内容进行评分。
? Gemma
https://www.kaggle.com/models/google/gemma-2
? Google 表单
https://link.gevents.cn/GemmaLanguageTuning
参加本次 Gemma 开放模型微调挑战赛,请填写此 Google 表单:
https://link.gevents.cn/GemmaLanguageTuning
提交参赛作品后,欢迎您在 "Android 开发者" 微信公众号后台留言,发送已提交作品的 Google 表单截图、Kaggle Notebook 链接以及竞赛报名的邮箱。审核后,我们将通过邮件与您联系,为您寄出一份 Google 定制精美礼品。
通用建议:
尽可能严格遵循指南,避免在规定范围之外进行操作。
清晰表述您做了什么、这样做的原因以及提交内容所属的类别。
尽可能让评分者能够轻松了解您的作品。
尽可能让评分者能够轻松了解为什么您的作品表现出色。
评估
资格要求
Notebook 内容应清晰易懂、记录详实且易于复制,以便他人能够理解作者使用的方法并加以借鉴。
成功报名参加竞赛的参赛者必须遵守以下要求:
创建详尽的 Notebook,演示如何有效地针对各种语言和/或文化背景对 Gemma 进行微调,包括有关数据集创建/管理、微调和推理的详细解释,如上文 "说明" 所述。
下面列出了 73 种符合条件的语言。
请注意,如果大小受限,您可以在 Kaggle Notebook 之外调整模型变体,前提是您需要在 Kaggle Notebook 中解释自己的方法是可复现的,并且您微调过的模型已发布到 Kaggle Models 上。
描述自己的数据集是如何创建的。
将自己的 Gemma 模型变体发布到 Kaggle Models。
提供运行模型推理的明确步骤。
合规:提交内容符合指南和说明。 | [是/否] |
贴合主题:提交内容与奖项类别相关。 | [是/否] |
开放:Notebook 和所有基础数据源均已公开。经过训练的模型已发布到 Kaggle Model Hub,并包含支持文档。 | [是/否] |
语言:所选语言是下方列出的符合条件的语言。 | [是/否] |
评估细则
技术性:该方法有效利用了少样本提示、检索增强生成和/或微调等策略。 | [0-10 分] |
描述性:详细描述了数据集的创建和/或管理。代码记录详尽,并且 Markdown 单元格既解释了代码,又提供了上下文。还清晰地解释了微调过程和推理步骤。 | [0-10 分] |
实用性:该方法产生的输出是有帮助或高质量的。 | [0-10 分] |
可靠性:当使用其他输入进行测试时,该方法的效果良好。 | [0-10 分] |
符合条件的语言
在本次竞赛中,有 73 种符合条件的语言,均是评委小组能够从专业角度进行验证和评估的语言。
竞赛官方网站
欢迎您查阅该竞赛的 Kaggle 官方网站,了解有关本次 Gemma 开放模型微调挑战赛的详细内容:
https://link.gevents.cn/GemmaLanguageTuning
推荐阅读
如页面未加载,请刷新重试
点击屏末 | 阅读原文 | 即刻报名参加 Gemma 开放模型微调挑战赛