2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

雷锋网(公众号:雷锋网)消息,2016 年 12 月 25 日,由 CCF 中国计算机学会主办、DataFountain 大数据平台等单位承办的“2016 CCF 大数据与计算智能大赛”(BDCI)正式落幕。

“CCF大数据与计算智能大赛”已成功举办三届,本届大赛引入 11 道来自创新企业与科研机构的大数据与人工智能领域高质量算法挑战赛赛题。多位大数据与计算智能领域顶尖人才,用作品赢得了行业专家的认可。

2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出

决赛队伍答辩现场

本次决赛中,中国科学院院士梅宏、中国工程院院士倪光南、青岛市副市长张德平、CCF 数据库专业委员会主任杜小勇、CCF大数据专家委员会秘书长、中国科学院计算技术研究所副所长程学旗、教育部易班发展中心主任朱明伦等多位政府、科研机构要员出席了“2016CCF大数据与计算智能大赛”的开幕式和颁奖典礼。

除此之外,国网信通产业集团副总经理孙德栋、中国联通研究院副院长张云勇、国双技术副总裁黄勇坚、AdMaster 技术副总裁卢亿雷等企业大数据领域精英,以及 70 余位学术界、产业界、投资界的专家评审就决赛作品进行专业点评。

2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出

中科院院士梅宏 致辞

最终,11 支技术团队从进入决赛的 55 支队伍中脱颖而出,其中:

  • 中科院信息工程研究所 S-LAB 团队的参赛作品“监控场景下的行人精细化识别”荣获 CCF 综合特等奖和企业单项奖一等奖。

  • 北京大学“fgo非洲人”团队的参赛作品“Human or Robot?”荣获 CCF 最佳算法能力奖;

  • 北京大学“FOO&Bar”团队的参赛作品“自动驾驶场景中的交通标志检测”荣获 CCF 最佳技术创新奖;

  • 北京大学“诗人都藏在水底”团队的参赛作品“生活大实惠:O2O 优惠券使用预测”荣获 CCF 最佳商业潜力奖;

  • 中国石油大学(华东)Chase 团队的参赛作品“石油大数据智能处理平台”荣获万国云商特别奖。

2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出

中科院院士梅宏、青岛市副市长张德平为CCF综合特等奖获奖团队“S-LAB”颁奖

官方对雷锋网透露,各参赛队伍在数据清洗、压缩以及特征提取方面下足了功夫,如分对象抽取的用户、商户、优惠券、Label窗等特征,以及分层次抽取的全局特征、局部特征、元特征等。以“fgo非洲人”战队为例,其通过对“Human or Robot?”赛题的 1.5 亿条数据进行特征分析,将数据量压缩至 500 万条,只有原来的三十分之一,极大提升了后续模型训练的时间。

2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出

“Fgo 非洲人”队在做决赛答辩

各战队在特征工程的基础上,也创新了多个算法模型。除了熟练运用 XGBoost、随机森林(RandomFore)、卷积神经网络(CNN)、循环神经网络(RNN)等常用数据挖掘模型,参赛队伍还对已有模型进行了优化和创新,如针对小目标检测的 R-FCN 算法、多任务学习框架的精细化人体属性识别算法。另有战队提出的多通道多窗口CNNs模型,只需 54 秒即可完成 2w 数据量的训练。“401 数据挖掘施工队”结合地理数据的经验,针对“基于多源数据的青藏高原湖泊面积预测”赛题,引入了数量平衡方程、彭曼蒸发公式等领域模型,利用时空关系构建的湖泊预测模型,实现了很好的效果。

雷锋网了解到,超过 1 万名的大数据技术牛人,6500 多支队伍参与大赛,初赛及复赛在 DataFountain 大数据竞赛平台提交了近 3 万份参赛作品,除了国内参赛选手及队伍外,美国、英国、法国、日本、澳大利亚等国家的海外团队也有参赛。参赛团队中有 54% 来自高校等学研机构,覆盖了国内所有 985 及大部分 211 院校,其中近 40% 为硕士及以上学历。参赛团队中,有二百余家企业及科研机构派出了多支团队,本次大赛在多个维度创下历史记录。

随着“CCF大数据与计算智能大赛”(BDCI)影响力的不断提升,或将成长为国际领域的行业盛会,并反哺加速全球大数据及计算智能的发展与创新。


本文作者:亚峰


本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
10天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
43 2
|
11天前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
|
6天前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
12天前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
15天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
37 3
|
15天前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
49 2
|
18天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
59 2
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
8天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
64 7
|
8天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
23 2
下一篇
无影云桌面