在云栖,一场关于数据洞察的创新实践

简介: 数据驱动创新·创新鉴于未来。做好数据洞察,是鉴往知来的必备条件。阿里云将携手广大开发者,进一步完善相关技术和工具,提供更好的产品和方案,让数据洞察的应用更加广泛和深入。

2023 年 11 月 2 日,是为期三天的云栖大会的最后一天。但对于开发者谭耀华来说,则是他和他的战队一举夺得了智能运维赛一等奖和智能创作赛二等奖的第一天。

本届云栖大会上有一个关键词被反复提起:开发者。阿里云 CTO 周靖人认为,大模型目前还在演进的初级阶段。是否要自己开发、要使用何种模型,都应该由效果决定。应该站在开发者视角,给开发者工具和选择,让他们自己去选型。


而由阿里云主办,阿里云天池平台联合阿里云存储团队承办的首届数据洞察创新挑战赛,正是一场面向广大开发者的技术竞赛。经过近半年的激烈角逐,共有 10 支队伍从 5000 多支队伍中冲出重围,来到了云栖的决赛现场。

颁奖照片


代码成就万世基积沙镇海,梦想永在凌云意意气风发。对于开发者而言,数据洞察创新挑战赛不仅提供了一个展示自己技术和智慧的平台,也为 AIGC、 AIOps 领域的创新和发展提供了新的思路和方向。


一、“AI+创作”——用影像讲故事,让照片有温度


AIGC 代表着 AI 技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来智能创作时代。近几年,文生文、文生图、文生视频/图生视频并行发展,这显然离不开背后的大模型。值得一提的是,大模型显著降低了开发者门槛,阿里云基础产品事业部负责人小邪坚信,有了广大开发者的支持,阿里云才能构建更为完善、完整的技术产品生态。

智能创作赛的选手依托于网盘与相册服务 PDS 技术能力,对相册中的图片进行“归纳总结”,并利用当前主流的 AIGC 技术做图片风格迁移、人像风格迁移,图像编辑等,生成了油画风、铅笔风等风格的“回忆故事”相册集和视频,展示出了数据与艺术的结合之美。


智能创作赛冠军团队“毛咕咕爱照相”的参赛选手樊雄杭,职业是一名金融风控算法工程师,同时也是一名摄影爱好者,他笑言自己是一个参加天池算法大赛 20 余次的拍照爱好者。在复赛过程中,他不仅充分发挥了一名摄影是对照片的美学理解,同时还借助图生文模型、图片质量评价模型、文本向量化模型、层次聚类算法等手段,最终实现了图片的风格迁移、标题生成、配乐类型选取以及视频的自动化生成。

而来自上海理工大学的数据新生队的熊成在参赛过程中,使用 AIGC 技术中的StableDiffusion 结合 ControlNet 实现根据用户需要可自定义进行图像风格编辑;并利用 BLIP 模型识别多图像语义并以此判断图像情感,确定需要的配乐;同时还利用图像文本结合 GPT2 实现故事扩写,并添加在相册视频中。


决赛评委代表、阿里云资深技术专家李文兆评价道,通过参赛作品的呈现,主办方看到了开发者在问题的理解、解决方案设计和实现过程中展现出的能力和创新思维。选手们不仅能够熟练运用数据分析和机器学习算法,还能结合自身的经验和专业知识对阿里云存储产品和服务加以利用,提出了优秀的解决方案。

二、“AI+运维”——自动定位故障,为“攻城狮”提效


随着业务走上云端,运维也逐步“云化”,基于微服务的架构在业务开发中扮演越来越重要的作用。在微服务系统中,业务请求(RPC)的整体延时、是否成功等和依赖的微服务调用息息相关。当线上发生业务请求变慢、失败时,工程师往往需要在各个调用节点中找到关键的节点和原因,并进行排除。


浙大观测云联合实验室团队认为,在当今信息技术领域,云原生和微服务架构成为主要趋势,提供了灵活性和可伸缩性,但随着微服务系统扩展,维护和故障排查变得复杂。多个微服务、分布式环境中的业务请求增加了故障排查难度。基于这样的实际情况,该团队提出了一种基于统计的自动故障定位算法,旨在通过数据分析和算法来自动定位产生慢请求的根本原因。该方法包括采样、预处理、统计和根因分析四个步骤,队员们详细探讨了不同的异常检测算法,其中 boxplot 算法表现出较高的性能。

来自中山大学的战队——一个队伍,在智能运维领域深耕多年,算法成果在合作企业中落地。为了对高延时 Trace 数据和错误的 Trace 进行诊断,得到对应的根因,设计了面向溯因的监控数据解析、基于分层建模的异常检测、根因定位、基于指标与追踪数据协同分析的蜕变测试反馈的流程,剖析并处理了根因定位的溯因挑战、建模挑战、反馈挑战。


阿里云资深技术专家、阿里云日志服务技术负责人简志表示,通过多维观测数据链路Trace、时序指标 Metric、日志明细 Log 进行有机融合构建体系化观测体系,同时提供丰富的业务应用视角的观测手段(包括依赖分析、性能剖析、故障排错及根因定位),实现从被动感知到主动观测的转变至关重要。

数据驱动创新·创新鉴于未来。做好数据洞察,是鉴往知来的必备条件。通过此次大赛,我们看到了参赛选手们的才华和创造力,也看到了数据洞察在各个领域的应用潜力。未来,阿里云将携手开发者,进一步完善相关技术和工具,提供更好的产品和方案,让数据洞察的应用更加广泛和深入。


附:数据洞察创新挑战赛获奖名单

智能运维赛:

一等奖:皮卡丘的皮卡

二等奖:一个队伍、浙大观测云联合实验室

三等奖:hoarz、合理想象队、畅捷数智队


智能创作赛:

一等奖:毛咕咕爱照相

二等奖:皮卡丘的皮卡、勇敢牛牛不怕困难

三等奖:数据新生、竞逐队、畅捷数智队

相关文章
|
4月前
|
人工智能 运维 监控
让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动
本次大赛由阿里云主办,云原生应用平台承办,聚焦 Operation Intelligence 的智能运维(AIOps)赛道,为热爱 AI 技术的开发者提供发挥创意和想象力的舞台,借助 LLM 强大的推理能力与标准化整合的多源可观测数据,找到 AI 应用在智能运维(AIOps)场景上的新方式。
589 31
|
10月前
|
存储 弹性计算 容灾
阿里云基础设施高可用最佳实践沙龙北京站圆满举办!
2025年3月19日,阿里云在北京举办高可用最佳实践沙龙,探讨云端业务连续性与架构设计。活动涵盖数据备份、故障切换、多活架构等主题,结合电商、金融等行业案例,分享高可用建设经验。专家强调,高可用不仅是技术命题,更是业务战略,助力企业实现“永不宕机”目标。系列沙龙将持续全国落地,推动企业云上容灾体系建设。
阿里云基础设施高可用最佳实践沙龙北京站圆满举办!
|
安全 网络安全 区块链
勒索病毒利如刀,上网备好技能包
网络安全已不是小说电影中遥远的黑客、间谍与烧脑幻想,而是关系到每一个人的切身利益。勒索病毒作为近年来黑客组织牟取暴利的绝佳手段,也是发展最快的网络安全威胁之一。
62468 9
勒索病毒利如刀,上网备好技能包
|
12月前
|
Java 关系型数据库 MySQL
MySQL 分库分表方案
本文总结了数据库分库分表的相关概念和实践,针对单张表数据量过大及增长迅速的问题,介绍了垂直和水平切分的方式及其适用场景。文章分析了分库分表后可能面临的事务支持、多库结果集合并、跨库join等问题,并列举了几种常见的开源分库分表中间件。最后强调了不建议水平分库分表的原因,帮助读者在规划时规避潜在问题。
1137 20
|
并行计算 PyTorch 算法框架/工具
基于CUDA12.1+CUDNN8.9+PYTORCH2.3.1,实现自定义数据集训练
文章介绍了如何在CUDA 12.1、CUDNN 8.9和PyTorch 2.3.1环境下实现自定义数据集的训练,包括环境配置、预览结果和核心步骤,以及遇到问题的解决方法和参考链接。
936 4
基于CUDA12.1+CUDNN8.9+PYTORCH2.3.1,实现自定义数据集训练
|
网络协议 算法 网络性能优化
关于TCP协议我们需要知道的
TCP协议是OSI模型中的传输层协议,用于建立和维护两个程序间的数据交换连接,以及通过Internet发送信息。TCP协议的主要特点包括面向连接、可靠性、流控制和拥塞控制。其中,三次握手和四次挥手是建立和断开TCP连接的必要过程。此外,TCP协议还提供了流控制机制来控制数据发送方的发送速度,以避免网络拥塞问题。
799 0
关于TCP协议我们需要知道的
|
机器学习/深度学习 人工智能 Cloud Native
2024 天池云原生编程挑战赛决赛名单出炉,冠军来自中山大学、昆仑数智战队
2024 天池云原生编程挑战赛由阿里云主办,云原生应用平台、天池以及市场营销部联合承办,本届大赛成功吸引了超过 20500 支队伍积极参与,参赛者来自 10 多个国家和地区,大赛规模创下历史新高。
|
Cloud Native Serverless 测试技术
祝贺!我的同事丁宇获“2023 年度云原生产业领军人物”荣誉称号
祝贺!我的同事丁宇获“2023 年度云原生产业领军人物”荣誉称号
1346 105
|
测试技术 API Python
掌握 Playwright:元素操作技巧大揭秘
Playwright Python 库简化了网页元素的交互,如点击和输入文本。使用 `click()` 方法可实现元素点击,`fill()` 方法用于在输入字段填充文本,而 `get_attribute()` 方法则用来获取元素属性值。这些功能在自动化测试和网页爬取中非常实用。
|
存储 人工智能 文件存储
阿里云吴结生:面向大规模数据智能的阿里云存储创新
近年来,越来越多人意识到,我们正处在一个数据爆炸式增长的时代。IDC 预测 2027 年全球产生的数据量将达到 291 ZB,与 2022 年相比,增长了近 2 倍。其中 75% 的数据来自企业,每一个现代化的企业都是一家数据公司。
1453 10
阿里云吴结生:面向大规模数据智能的阿里云存储创新