可图Kolors-LoRA风格故事挑战赛决赛入围名单出炉!决赛赛题首公开,奉上夺奖秘籍!

简介: 8月初,魔搭社区联合阿里云天池平台,结合快手旗下开源文生图大模型可图Kolors 模型,推出文生图创作大赛,30支队伍脱颖而出,晋级复赛。

8月初,魔搭社区联合阿里云天池平台,结合快手旗下开源文生图大模型可图Kolors 模型,推出文生图创作大赛——可图Kolors-LoRA风格故事挑战赛。近1个月来,活动吸引了1338支队伍报名参加,通过系列专题学习和实践活动,社区开发者贡献了700+基于Kolors训练的风格LoRA模型,提交300+初赛作品。最终,通过主观评分(技术运用、风格连贯性、视觉效果)、客观评分(美学打分)两个维度,30支队伍脱颖而出,晋级复赛。

决赛名单

决赛入围作品围观:

https://modelscope.cn/brand/view/Kolors?branch=0&tree=1(含人气LoRA模型奖项公布)

决赛赛题

🌠 赛题:

经典故事再现:可以基于以下经典故事的情节,创作出与之相符的图文故事,8图以上。原创故事续写:也可以在以下经典故事的基础上,发挥想象,创作出全新的图文故事,8图以上。

可选故事列表:

·《西游记》:以唐僧师徒西天取经的奇幻旅程为背景。 ·《三国演义》:以三国时期的政治和军事斗争为背景。 ·《射雕英雄传》:以南宋末年侠义传奇为背景。 ·《甄嬛传》:以清宫后宫的权谋和情感纠葛为背景。 ·《三体》:以宇宙文明的碰撞和人类的生存危机为背景。 ·《哈利波特》:以魔法世界和霍格沃茨的冒险为背景。 ·《灌篮高手》:以高中篮球队的成长和比赛为背景。 ·《蝙蝠侠》:以哥谭市的超级英雄和犯罪斗争为背景。

作品表现形式:图文、PPT、视频等形式不限,详见决赛要求

https://modelscope.cn/brand/view/Kolors?branch=0&tree=0

🕥 时间:

9月9日-下午14:00-17:00 答辩展示,线上决出一二三等奖,很精彩!请预约观看~

决赛秘籍

引言

魔搭官方给出了决赛作品示例,帮助各位选手在决赛中创作出更优质的内容。

以下以《三体》为故事背景,根据“黑暗战役”的故事情节进行了改编,使用Kolors模型微调,生成了 16 张图的漫画。

也可以剪辑成视频进行展示~

以下为详细攻略~

1、人物构建

在这个故事中,主角是《三体》中的人类指挥官“章北海”,由于原作小说中并没有对这一角色外貌的详细描述,我们要自己发挥,构建一个章北海的肖像数据集。

对于这样一位意志坚定的指挥官,我们先想像出他的外貌,用语言表达出来——“太空舰队上,人类军团的指挥官,男性,白发,眼神坚毅,身穿纯白色军装,身上的衣服洁白无暇,美漫风格”,接下来让模型自己生成相应的图像。当然,模型生成的图像必然具有多样性,所以我们在生成的结果中挑选了几张相似的图像。

接下来,我们通过训练角色 LoRA 把这一外貌特征固定下来。在生成的图片中挑选出所有符合这一外貌特征的,构建一个数据集,数据集中每一张图对应的文本描述统一为“章北海”,这样一来,这个角色 LoRA 就可以让模型记住“章北海”这一角色的样子。

2、文案提炼

在构建完整故事的过程中,必然需要提炼出故事的文案,这需要选手们有一定的文学功底。但故事文案有时并不适合作为提示词控制模型生成图像,例如第 10 张图

这一幕展现手放在按钮上方的情景更能体现此时章北海内心的犹豫,同时也提高了整个故事中画面的多样性,因此我们建议文案和提示词分开撰写。

3、细节微调

完善的故事与精美的画面不是一蹴而就的,通常需要多次微调。例如,我们在构建“章北海”的外貌时没有描述眼睛的颜色,所以生成的画面可能包含其他颜色的眼睛,第 4 张图就是一个很好的例子,为了避免这种情况,我们就需要额外调整提示词,尽可能详细地描述人物特征。

此外,画面内容出现渐变式的改变时,固定随机种子,可以使画面保持一定的一致性,例如第 7 张图和第 11 张图中的飞船。不过,使用另一个 LoRA 控制飞船的外观是更合理的做法。

最后不要忘了,LoRA 模型可以叠加多个,在使用角色 LoRA 固定角色外貌的同时,还可以额外使用风格 LoRA 改变整体的画面风格,例如古代故事适合水墨风格,合理利用 LoRA 微调技术,可以创作出美轮美奂的艺术作品!

🌟预祝所有入围决赛的队伍都可以发挥出色,角逐大奖!


点击链接👇阅读原文

https://www.modelscope.cn/brand/view/Kolors?branch=0&tree=0?from=alizishequ__text

相关文章
|
存储 缓存 安全
Java集合框架(Map篇)
在这个示例代码中,首先定义了一个数组和一个集合,并使用Arrays.asList()方法将数组转换成集合。接着对数组和集合分别进行排序,使用binarySearch()方法查找元素位置,使用copyOf()和copy()方法复制数组和集合,最后输出结果。可以看到,Arrays和Collections提供的方法可以方便地对数组和集合进行操作,节省开发者的时间和精力。
|
运维 测试技术
当一个按键“摆烂”时,需要更换整个键盘吗?
键盘按键失灵时,别急着更换整个键盘!本文教你通过三步解决:诊断病因、对症下药、预防复发。首先进行“键盘体检”,包括跨设备验证、软件驱动测试、BIOS检测及硬件检查,找出是污垢、物理损坏还是电路故障。接着针对问题提供治疗方案,如更新驱动、清洁键槽或更换零件。最后提醒大家优先排查软件问题,温柔清洁,理性对待物理损坏,并建议选购可维护性强的键盘。记住,善待键盘,远离零食屑,让输入更顺畅!
805 3
|
人工智能 机器人 Linux
把大模型变成微信私人助手,三步搞定!
随着大模型的应用越来越广泛,相信大家都对拥有一个自己的私人AI助手越来越感兴趣。然而基于大模型遵循的"规模效应"(Scaling Law)原理,传统部署方式面临三重阻碍:高昂的运维成本、复杂的技术门槛(需掌握模型部署、量化等技术概念)以及系统集成难题。
1350 0
|
监控 数据可视化 安全
SaaS智慧工地云平台源码 视频监控、机械设备、环境监测、劳务分析、进度管理
自动监测塔机和施工升降机的运行情况,且在有危险源时及时发出报警和输出控制信号,并可全程记录特种设备的运行数据,将数据传输至云平台,为相应操作人员的管理提供数据支持。
405 1
|
Apache
apache指定ip可访问,并输出指定错误
apache指定ip可访问,并输出指定错误
140 1
|
前端开发 测试技术 API
NuxtJS3配置多环境变量
OK,配置完成~~~~~~
546 4
|
机器学习/深度学习 人工智能 算法
阿里妈妈智能造字,设计赋能商业再升级
01.造字源始——赋能商业-文字设计在促进人类的交流与沟通方面扮演着一个重要角色,也经历着越来越多的变化,尤其是电脑技术的出现和发展给现代设计注入了新的活力,作为视觉传达的重要因素之一 ——文字,也应顺应当下的变化,以积极主动的姿态满足现代媒体和社会心理的功能需要。字体的设计伴随着商业的发展逐渐开拓了字体应用的新大门,特别是在营销相关的设计行业当中,需求量激增。专注服务于商业的阿里妈妈一直秉持“让
3172 0
阿里妈妈智能造字,设计赋能商业再升级
|
搜索推荐
深入理解数据结构第五弹——排序(2)——快速排序
深入理解数据结构第五弹——排序(2)——快速排序
286 0
|
JavaScript 前端开发 算法
Vue 3 常见面试题汇总
Vue 3 常见面试题汇总
865 0