在数据的调味中探寻秘密,再次点燃 LLM 美食节的激情!欢迎踏入第二届 Data-Juicer 数智大赛:“BetterMixture - 大模型数据混合挑战赛”。
亲爱的数据大厨们,继上次 FT-Data Ranker 厨艺的精彩亮相后,是时候挑战更加精细的调味技巧了!如何从数不胜数的数据原材料中,巧妙选择、精心混合,才能创造出最适合大模型口味的美食?这就是本届比赛的核心挑战!
在 BetterMixture 赛事中,您将扮演一位数据调味大师,利用主办方提供的候选微调数据集,融合您的智慧与经验,设计最佳的数据配比与智能采样方案。利用这份经过您巧手混合的调味料(微调数据集),对基础大语言模型进行高效率的微调,释放其隐藏的强大潜能。
为了支持您的创作,Data-Juicer 再次披挂上阵,为您提供一站式、系统化、可复用的数据加工工具和算子,以便您迅速上手、并焕发创意。我们细心准备的 Jupyter Notebook 将引导您快速了解比赛流程,让您一路畅通无阻。
在这场“料理”竞技场上,每位参赛者都将面对相同的挑战规则,包括模型、训练算法等,确保公平竞争。在这里,您不需要庞大的计算设备,单卡 16G 显存即可玩转大模型数据混合,让您轻松驾驭数据的海洋。无论是新锐数据工程师还是资深机器学习专家,都能在这个赛场上一展自己的才华。
参赛者不仅有机会赢得丰厚的现金奖励,更能与全国各地的同行们一较高下,激烈角逐。这不仅是一场比赛,更是一个深入探索数据混合策略和推动大语言模型发展的绝佳机会。
准备好您的“调味”技巧吧,第二届 Data-Juicer 大模型数据挑战赛已经拉开帷幕。加入我们,共同揭开数据与大模型协同演进的新篇章!更多信息请访问比赛官网,期待您的精彩加入!
比赛官网:
https://tianchi.aliyun.com/competition/entrance/532174
Data-Juicer 开源代码:
https://github.com/alibaba/data-juicer
点击直达报名:https://tianchi.aliyun.com/competition/entrance/532174