首届 Apache Spark AI智能诊断大赛重磅来袭!

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 本次大赛将由阿里云计算有限公司、英特尔(中国)有限公司联合主办,湘雅医院、浙江大学附属第二附属医院、解放军301医院作为指导单位,唯医骨科共同合作,全程有资深技术专家提供技术指导。本次挑战的目标是通过核磁共振成像来检测和分类脊柱的退行性改变,形成一批创新性强、复用率高的算法案例,并积极推动相关技术的临床应用,用科技造福医疗事业,鼓励人工智能与疾病预防深度融合的应用落地,由点到面驱动国内人工智能医疗产业发展,向公众真正意义上展示大数据AI在整个社会不可替代的价值。

SparkAI_1080_1584 Poster.jpg

Spark“数字人体”AI挑战赛——脊柱疾病智能诊断大赛介绍

首届 Apache Spark AI智能诊断大赛由阿里云、Intel、Databricks 共同举办。Spark“数字人体”AI挑战赛——脊柱疾病智能诊断大赛,召集全球开发者利用人工智能技术探索高效准确的脊柱退化性疾病自动诊断,并积极推动相关技术的临床应用。本次比赛尤其鼓励企业参赛,代表企业参赛并进入第二赛季的队伍,将有机会成为阿里云医疗行业合作伙伴。

本次大赛分为第一赛季、第二赛季、决赛三个阶段, 进入第二赛季的队伍将会被要求选择赛道,结合选手初赛排名情况和意向,选手将会被分配分别到GPU赛道和CPU赛道。

报名及实名认证(2020年5月20日-7月17日)
第一赛季(2020年6月10日-7月17日,UTC+8)
第二赛季(2020年7月20日-8月30日,UTC+8)

选题背景

脊柱退化性疾病,如腰椎间盘突出等症状正呈现出年轻化的趋势,困扰着老年人群体和办公族,正确的预防和干I能够有效防止疾病的恶化。核磁(MRI)作为非侵入式检查手段,对软组织成像好,无辐射,对肌肉骨骼疾病的特异性和敏感度较高,适合对普通人群的常规检查,是预防脊柱退化性疾病的可靠检查手段。同时临床上,对脊柱退化性疾病的诊断的一致性有待提高,人工智能算法在临床流程中可以帮助提高诊断的一致性和可量化性,对量化评估针对脊柱退化性疾病的干预效果有着很高的价值。本次大赛将召集全球开发者利用人工智能技术探索高效准确的脊柱退化性疾病自动诊断,并积极推动相关技术的临床应用。

本次挑战的目标是通过核磁共振成像来检测和分类脊柱的退行性改变。共有6类靶点,包括正常椎体、退变椎体、正常椎间盘、椎间盘突出、膨出等情况。参赛者需要提供AI算法来预测每个MRI中脊柱的位置和分类。

钉钉交流群

  • Spark数字人体挑战赛选手问答钉钉群

入群链接:https://qr.dingtalk.com/action/joingroup?code=v1,k1,vEss45OKjBPFFVOCq+eZSYrLYVKhO0CL8WmszL+TsQU=&_dt_no_comment=1&origin=11
image.png

  • Apache Spark中国技术交流社区
    image.png

Tips:

首届 Apache Spark AI 智能诊断大赛参赛福利,本次大赛涉及 Spark 的深度应用,可参考 Apache Spark 技术圈 https://developer.aliyun.com/group/apachespark 整理的实践经验和组合案例;关于EMR的入手学习可参考其官网的文档 https://www.aliyun.com/product/emapreduce 充分发挥学习教程的作用;除此之外,我们还会邀请Intel、阿里云EMR、达摩院、Databrics公司的技术专家在选手交流群内分享直播,不容错过哦。

报名入口及赛题详情:

https://tianchi.aliyun.com/competition/entrance/531796/introduction

发起人计划

1.从比赛上线起,成功邀请身边小伙伴参赛即可成为发起人。入伙发起人,可赢取丰厚礼品。
如果你是关注学术赛事的高校老师,或者运营鬼才,亦或是一呼百应的明星选手,赛事发起人计划诚邀你的参与!

2.被邀请选手需要在报名时填写发起人姓名/手机号码。
image.png

3、发起人名单每周统计一次发布公示。榜单于7月19日18:00停止更新。获奖发起人请加入钉钉选手问答群【如上】,私聊群主收件地址,礼品发放时间:2020年8月底前。奖品可叠加哦~

image.png
社区礼物.JPG

总体赛程安排:

报名及实名认证(2020年5月20日-7月17日)

1、报名方式:登录比赛官网,完成个人信息注册,即可报名参赛;
2、选手可单人成队或2-3人组队参赛,每位选手只能加入一支队伍;
3、选手需确保报名信息准确有效,组委会有权取消不符合条件队伍的参赛资格及奖励;
4、选手报名、组队变更等操作截止时间为7月17日10:00 AM;
5、各队伍(包括队长及全体队伍成员)需要在7月17日中午12:00 AM前完成实名认证(认证入口:天池官网-右上角个人中心-认证-支付宝实名认证),未完成认证的参赛团队将无法进行正式比赛;

第一赛季(2020年6月10日-7月17日,UTC+8)

1、报名成功后,参赛队伍通过天池平台下载数据,本地调试算法,在线提交结果。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。
2、第一阶段(6月10日-7月16日)每天提供2次的评测机会,系统排行时间为11:00、21:00,每天更新排行榜,按照评测指标从高到低排序;(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,不做最终排名计算)
3、第二阶段(7月17日)系统将在17日11:00更换测试数据(加密),参赛团队需要再次下载数据文件,17:00公布数据集密码,本轮仅有1次测评机会,系统将在21:00进行评测,并清空排行榜进行重新排名。
4、第一赛季截止后(7月17日21:00最后一次测评),组委会将进行排名前100名参赛队伍的入围审核。部分团队将需要提交代码作为补充材料进行审核,组委会将识别只靠人工标注而没有算法贡献的队伍,并终止上述团队参赛,晋级空缺名额后补。直接使用开源的baseline产出成绩,没有算法贡献的参赛团队无法进入复赛。

第二赛季(2020年7月20日-8月30日,UTC+8)

1、 复赛环节,进入复赛的队伍将会被要求选择赛道,结合选手初赛排名情况和意向,选手将会被分配分别到GPU赛道和CPU赛道,每个赛道50个队伍;
2、复赛参赛队伍在线获取训练数据和更新的测试数据,在线提交调试算法,在线提交结果。
3、复赛数据不可下载,选手需使用比赛提供竞赛环境完成数据处理、建模、算法调试、产出结果等所有环节。环境内置了Tensorflow、Pytorch等框架,同时也可自行安装需要的第三方库。
4、2020年7月20日起提供每天1次的评测和排名机会,系统评测开始时间为10:00AM,每天更新排行榜,按照评测指标从高到低排序(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,GPU和CPU赛道分别统计排名情况);
5、第二赛季截止时(2020年8月30日10:00)GPU和GPU赛道的TOP12团队分别进入代码审核。代码审核要求选手提交的代码结构清晰,根据说明可直接通过脚本重新完成模型的训练与推断,复现比赛成绩。此外,在审核阶段会着重比较代码的重合度。复赛代码审核通过的GPU和GPU赛道的TOP6的参赛队伍选手代表将分别受邀参加决赛。

奖项设置

GPU赛道:

冠军:1支队伍,每支队伍奖金拾万,颁发获奖证书
亚军:2支队伍,每支队伍奖金伍万,颁发获奖证书
季军:3支队伍,每支队伍奖金壹万,颁发获奖证书
(上述奖项以决赛答辩的最终名次决定)

CPU赛道:

冠军:1支队伍,每支队伍奖金拾万,颁发获奖证书
亚军:2支队伍,每支队伍奖金伍万,颁发获奖证书
季军:3支队伍,每支队伍奖金壹万,颁发获奖证书
(上述奖项以决赛答辩的最终名次决定)

大赛组织

主办单位:阿里云计算有限公司
协办单位:英特尔(中国)有限公司
合作单位:唯医骨科
指导单位:湘雅医院;浙江大学附属第二附属医院;解放军301医院

▼ 学习传送门 ▼
https://developer.aliyun.com/group/apachespark

https://developer.aliyun.com/group/aliyunemr

https://www.aliyun.com/product/emapreduce

报名链接:
https://tianchi.aliyun.com/competition/entrance/531796/introduction

首届 Apache Spark AI 智能诊断大赛希望为所有大数据技术爱好者以及相关的科研企业提供挑战平台,用科技造福医疗事业,真正意义上向公众展示大数据AI在整个社会不可替代的价值。大赛全程有资深技术专家提供技术指导,欢迎大家积极挑战,报名参与~

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
6月前
|
分布式计算 大数据 数据处理
Apache Spark:提升大规模数据处理效率的秘籍
【4月更文挑战第7天】本文介绍了Apache Spark的大数据处理优势和核心特性,包括内存计算、RDD、一站式解决方案。分享了Spark实战技巧,如选择部署模式、优化作业执行流程、管理内存与磁盘、Spark SQL优化及监控调优工具的使用。通过这些秘籍,可以提升大规模数据处理效率,发挥Spark在实际项目中的潜力。
460 0
|
6月前
|
机器学习/深度学习 SQL 分布式计算
Apache Spark 的基本概念和在大数据分析中的应用
介绍 Apache Spark 的基本概念和在大数据分析中的应用
251 0
|
6月前
|
机器学习/深度学习 SQL 分布式计算
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
|
3月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
103 1
|
20天前
|
分布式计算 大数据 Apache
利用.NET进行大数据处理:Apache Spark与.NET for Apache Spark
【10月更文挑战第15天】随着大数据成为企业决策和技术创新的关键驱动力,Apache Spark作为高效的大数据处理引擎,广受青睐。然而,.NET开发者面临使用Spark的门槛。本文介绍.NET for Apache Spark,展示如何通过C#和F#等.NET语言,结合Spark的强大功能进行大数据处理,简化开发流程并提升效率。示例代码演示了读取CSV文件及统计分析的基本操作,突显了.NET for Apache Spark的易用性和强大功能。
31 1
|
4月前
|
存储 运维 关系型数据库
探索 Apache Paimon 在阿里智能引擎的应用场景
本文整理自Apache Yarn && Flink Contributor,阿里巴巴智能引擎事业部技术专家王伟骏(鸿历)老师在 5月16日 Streaming Lakehouse Meetup · Online 上的分享。
25060 34
探索 Apache Paimon 在阿里智能引擎的应用场景
|
3月前
|
敏捷开发 人工智能
首届中国Scrum大会-共同探讨AI时代下的敏捷(Agile in the AI Age),共同探讨Scrum框架在中国市场的应用与发展
​ 中国「首届Scrum大会」将于2024年8月17日在上海大华虹桥假日酒店盛大召开。在全球数字化转型的浪潮中,敏捷已成为企业脱颖而出的关键。本次大会汇聚了Scrum领域的顶尖专家、实践者及企业领袖,共同探讨AI时代下的敏捷(Agile in the AI Age),深入探索智能时代的敏捷路径,掌握应对未来挑战的关键策略,共创智慧与敏捷融合的新纪元! 此次大会吸引了来自全国各地的行业专家、企业领导、Scrum Master和敏捷从业者,共同探讨Scrum框架在中国市场的应用与发展。
|
3月前
|
分布式计算 Hadoop 大数据
大数据处理框架在零售业的应用:Apache Hadoop与Apache Spark
【8月更文挑战第20天】Apache Hadoop和Apache Spark为处理海量零售户数据提供了强大的支持
61 0
|
3月前
|
分布式计算 Serverless 数据处理
EMR Serverless Spark 实践教程 | 通过 Apache Airflow 使用 Livy Operator 提交任务
Apache Airflow 是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark 为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过 Apache Airflow 的 Livy Operator 实现自动化地向 EMR Serverless Spark 提交任务,以实现任务调度和执行的自动化,帮助您更有效地管理数据处理任务。
195 0
|
4月前
|
分布式计算 Apache Spark

推荐镜像

更多