发光的二次元——克拉克拉上云实践

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: MaxCompute提供完善的数据导入方案以及多种经典的分布式计算模型,可快速解决克拉克拉所面临的海量数据的计算问题,有效降低企业成本并保障数据安全。对于使用方的我们不必关心分布式计算和维护细节便可轻松完成大数据分析,最终我们采用阿里云MaxCompute方案进行数据上云。

作者:田亮 深圳市有信网络 大数据团队负责人

克拉克拉(KilaKila)是国内专注二次元、主打年轻用户的娱乐互动内容社区软件。KilaKila 推出互动语音直播、短视频配音、对话小说等功能,满足当下年轻用户个性化、碎片化的文娱需求。随着业务规模增长,海量数据存储与计算的瓶颈也日益突出,由于单台服务器的处理能力有限,海量数据的分析需要分布式计算模型。分布式的计算模型对数据分析人员要求较高且不易维护:数据分析人员不仅需要了解业务需求,同时还需要熟悉底层分布式计算模型。MaxCompute提供完善的数据导入方案以及多种经典的分布式计算模型,可快速解决克拉克拉所面临的海量数据的计算问题,有效降低企业成本并保障数据安全。对于使用方的我们不必关心分布式计算和维护细节便可轻松完成大数据分析,最终我们采用阿里云MaxCompute方案进行数据上云。

一、数据上云

克拉克拉(KilaKila)数据源主要分为两部分:1.结构化业务数据表(MySQL);2.非结构化用户行为日志

 结构化业务库上云主要使用阿里云datax、DTS两种工具。
image.png

▲图一:datax数据同步

datax原理是将MySQL数据完全透明化同步至MaxCompute数据表中,是表对表的映射。

image.png

▲图二:DTS数据同步

DTS主要以MySQL binlog方式来进行数据同步,该同步的优势在于不会影响线上生产环境MySQL库I/O压力,与此同时对于删除操作也会进行实时同步。

 用户行为日志上云,该日志主要使用阿里云日志服务(Log Service)组件。该组件除了满足将海量日志存储在MaxCompute数据仓库中外,也解决了实时业务计算需求,如storm集群。

image.png

▲图三:Log Service工作流
image.png

▲图四:日志服务各Topic日志源
image.png

▲图五:克拉克拉用户行为日志片段

二、数据计算

为满足各类批处理计算业务需求,基于MaxCompute建立了小时维度、天维度、月维度等不同维度的工作流以及业务流程。在数据开发阶段我们使用MaxCompute的Web datawork进行任务开发、任务运维、任务监控等。

image.png

▲图六:datawork SQL开发
在datawork中可以创建SQL脚本,通过编写SQL语言满足我们的临时查询需求。

image.png

▲datawork工作流

在datawork中可以根据业务场景配置工作流,解决生产环节中所面临的定时计算任务等诉求。

image.png

图七:datawork运维中心
运维中心可实时监控任务的状态,对应不同的任务状态进行不同情况的报警;
综上所诉,得益于datawork强大的数据开发多样性和丰富的内置函数,我们可以针对不同业务场景进行快速的项目开发和上线。

三、克拉克拉业务应用场景

克拉克拉(KilaKila)在实际生产环境中,主要有以下四个数据业务应用场景。如下:

  1. 报表系统
    image.png

▲图八:克拉克拉BI报表系统架构

基于MaxCompute与quickBI组合快速构建了业务报表系统。该系统通过datawork部署系列报表计算任务,最终的计算结果可存储MaxCompute表中以及MySQL表中。quickBI通过数据源关联即可实现前端趋势图灵活展示。

image.png

图八:克拉克拉BI报表系统

  1. 克拉克拉(KilaKila)榜单业务

image.png

图九:克拉克拉榜单业务计算场景

通过MaxCompute满足了克拉克拉主播排行榜、热门榜单等排序业务。

  1. 对外开放接口平台(Restful API )
    为了满足第三方通过API接口获取克拉克拉数据仓库中的用户标签数据,基于MaxCompute Lightning架构搭建开放接口服务,通过该服务的网关鉴权机制保证了授权访问和防DDOS攻击。

image.png

图九:克拉克拉开放接口结构

4.算法业务
阿里云机器学习平台是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。克拉克拉(KilaKila)预测算法业务、推荐业务等相关项目均建立在机器学习平台基础上,项目上线快且效果符合预期。

image.png

▲图九:克拉克拉短视频推荐业务
image.png

图十:克拉克拉渠道ROI预测业务
通过阿里云所提供大数据解决方案,除了解决了克拉克拉所遇到的大数据挑战,也极大的缩短了克拉克拉(Kilakila)诸多数据项目从想法到落地的研发周期。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
人工智能 黑灰产治理 开发者
虚拟模特,一键生成高颜值AI模特!活动震撼来袭,快来生成你的高颜值模特大片!
体验”通义万相-虚拟模特“,晒出属于你的高颜值AI模特大片,在活动页面提交作品以及使用反馈,即有机会获得反馈奖哦!
662 10
虚拟模特,一键生成高颜值AI模特!活动震撼来袭,快来生成你的高颜值模特大片!
|
前端开发 JavaScript
径向聚焦,你就是全场最靓的仔
通过mask-image属性我们得到了一个径向聚焦的效果,通过css变量让这个聚焦效果可以随着鼠标的移动而移动,接下来就一起来看看这个效果是如何实现的吧。
61 0
|
机器学习/深度学习 编解码 人工智能
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力 NBA赛事超清画质的背后:「窄带高清2.0」技术深度解读(中)
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力 NBA赛事超清画质的背后:「窄带高清2.0」技术深度解读
263 0
|
编解码 算法
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力 NBA赛事超清画质的背后:「窄带高清2.0」技术深度解读(下)
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力 NBA赛事超清画质的背后:「窄带高清2.0」技术深度解读
222 0
|
编解码 人工智能 算法
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力-如临现场的视觉感染力,NBA决赛还能这样看?
超越感官,沉浸赛场——大型体育赛事云上实战精选-第二章 NBA 总决赛:窄带高清的视觉渲染力
203 0
|
人工智能 监控 数据可视化
真·手把手教学!早稻田大学利用VR设备,让机械臂教你正确的乒乓球挥拍姿势
真·手把手教学!早稻田大学利用VR设备,让机械臂教你正确的乒乓球挥拍姿势
268 0
真·手把手教学!早稻田大学利用VR设备,让机械臂教你正确的乒乓球挥拍姿势
|
机器学习/深度学习 消息中间件 人工智能
爱奇艺蒙版AI:弹幕穿人过,爱豆心中坐
作为(伪)AI 行业从业者,之心编辑部里的小伙伴们自认都能够以不错的置信度人工识别「人工智能与人工智障」。但是,当我把下面这张爱奇艺 app 的截图放在大家面前时,编辑部的「识别器」们纷纷表示,这次置信度不高。
436 0
爱奇艺蒙版AI:弹幕穿人过,爱豆心中坐
|
人工智能 算法 机器人
机器人眼中的光影世界
我们开发程序来进行照片中的人脸识别,或者来统计交通阻塞中的汽车数量,我们将自己眼中的世界强加给电脑,因为我们已经习惯性的他们当成了工具,一个帮助我们更好了解自身世界的工具。
189 0
|
存储 机器学习/深度学习 人工智能
明厨亮灶上云 | 看阿里云智能视觉平台如何保护舌尖上的安全?
这种技术能让你外出就餐幸福感瞬间提升!
5093 0
明厨亮灶上云 | 看阿里云智能视觉平台如何保护舌尖上的安全?