「镁客·请讲」创略科技杨辰韵:打通线上线下数据,用AI和大数据玩转营销

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 有的时候,算法本身以及技术并不是难题,最大的问题在于数据收集的维度以及不同数据的打通。

有的时候,算法本身以及技术并不是难题,最大的问题在于数据收集的维度以及不同数据的打通。

亚马逊最早的理念就是构建一个千人千面的书店,基于你当前的场景和过去的行为,每个读者看到的推荐页都是不一样。

这套推荐系统最早从1998年开始,至今走过了20个年头,其算法已经被广泛地应用在YouTube、Netflix等公司。

这是我们最早对大数据的直观认识,后来基于大数据的推荐系统越来越频繁地出现在我们的日常生活中,大数据也成为炙手可热的技术潜力股。

在无数据不AI的时代下,许多初创公司开始将眼光瞄准其背后的营销场景,比如你是星巴克的会员,想要在外卖平台点一杯咖啡,系统会自动推荐你平常最喜欢的口味。

这背后就是我们今天所采访的智能数据公司创略科技提供的技术支持,从硅谷创业到服务300+标杆企业,创略科技联合创始人杨辰韵和我们聊了聊大数据是如何解放营销天性的。

关于数据的二三事

在美国读书期间,杨辰韵因为对数字营销的兴趣和另外一个合伙人,也就是创略科技的创始人胡世杰一拍即合,开始考虑基于营销场景,用大数据、人工智能或者新兴的区块链等技术,来去让营销场景更加实时智能,高效,创略科技应运而生。

TB1LUgslFzqK1RjSZFoXXbfcXXa.jpg

图 | 创略科技联合创始人杨辰韵

相较于国内,国外的大数据应用起步明显更早,尤其是在技术层面。不过,伴随着国内的人口红利优势带来的庞大消费者用户体量,国内的大数据应用场景显然更加丰富。但杨辰韵强调国外对于数据安全的意识明显要高于国内。

“因为Facebook的数据泄露事情,美国加州已经通过法案,隐私数据一定要确保经过用户的授权才能去使用,或者和第三方去做相关的交换。欧洲针对这个问题可能比美国的更早。国内去年6月份的网安法(《网络安全法》)规定了第三方数据交易的情况。但是企业自用的话,相对来说还是比较松的。长期来看,无论是哪个层面的数据,一定要从法律和价值的层面去确保消费者的授权。”

确实,谈及数据,很多人的第一反应就是数据隐私问题,最近因为泄露用户隐私而站在风口浪尖的谷歌,不得不关闭google+的消费者版本。再往前则是Facebook的数据泄露风波。随着移动互联网和AI时代的到来,数据是很多技术以及应用的水之源。但是“不作恶”的前提是尊重用户的数据安全,得到用户的数据确权。

这也是许多大数据公司面临的考验,为了更好地解决这些问题,创略科技开始了区块链方面的研究。区块链的可追溯、不可篡改性决定了它可以确保消费者的隐私数据一定是在已知授权的情况下,企业才可以使用的。当前技术难度在于底层公链的TPS吞吐量。“如果这个场景需要很高的TPS的,在现有情况下就不适合用区块链技术。短期来说,区块链还像20年前的互联网。目前在拨号上网的状态。”

同时,创略科技的业务模式规避了数据风险。杨辰韵介绍,创略科技仅是一家数据及AI技术公司,旗下智能客户数据平台专注应用的是企业第一方客户数据,本身并不是采集数据的第三方供应商,也不充当卖数据的角色。

如何玩转大数据营销?

创略科技的一个核心要点就是“营销”,目前他们的产品线主要包括三条:多渠道数据打通、整合的NEXUS(企业级客户数据平台),数据建模、分析、预测的IQ(企业级人工智能应用)以及负责保护用户数据隐私的区块链产品APEX。其中,最关键的是一块是基于企业第一方数据的客户数据平台,从客户数据的采集、分析和应用的环节上,做到实时的海量数据处理,最终做实时个性化营销的场景。

TB11YMllSrqK1RjSZK9XXXyypXa.jpg

很多企业拥有很多渠道,比如APP、官方网站、微信公号等等,但这些渠道都是彼此隔离的。接入NEXUS后,企业可以将这些渠道的非实时数据和实时数据都输入到NEXUS中,从而发现不同数据集之间的共性和特性,以此来更好地进行企业决策。

据杨辰韵介绍,目前他们在零售和汽车行业的应用最多,其中以星巴克系统为例,创略科技解决的核心问题如何打通线上线下的数据,形成基于用户个人的唯一ID和画像,然后提供相关的分析和营销建议。

而在大数据营销的准确性上,杨辰韵提到他们的算法模型去预测玛莎拉蒂潜在客户的购车意向,预测准确率可以高达95%,这其中的关键因素就是他们的IQ产品,创略科技在分析环节扩展了AI模块,用户可以直接调用模块内已预制的算法和模型,也可以自定义相关模型去分析营销数据。

当然,这条赛道上狂奔的初创企业不仅仅是创略科技一家,谈及他们的技术优势,杨辰韵总结了三点:一是大数据的打通和分析应用,二是算法的准确度,最后是它们产品的迭代以及行业内的先发优势。

“机器会帮助我们做一些机构化数据的分析建模,进行客户分群,同时自然语言处理技术能够快速提取数据中的关键内容,这些都能保证我们在算法准确度上的壁垒。”

大数据应用那么多,难题在哪里?

在学术界,曾经有这样一个观点:“真正能够训练出好的模型的数据量,应当是趋于无穷的,所以即便是拥有了大量数据去训练模型,和理想的智能模型之间,也有着本质的差别。”

在杨辰韵看来,算法本身以及技术并不是难题,最大的问题在于数据收集的维度以及不同数据的打通。同样以营销领域为例,线上用户点击的广告、网页的浏览行为等数据容易收集,同时伴随着IoT的发展,通过WIFI、蓝牙、摄像头等方式,也可以监测到用户的线下行为,最终打通线上线下的闭环。

但是这种数据的融合以及打通并不是一帆风顺,“有的时候和企业的战略组织架构有关系,比如它们的组织架构不允许打通所有数据,一个部门和另一个部门的数据无法打通,这些都不是技术问题,这是架构问题。”

TB1joAwlG6qK1RjSZFmXXX0PFXa.png

同时,在打通线上以及线下数据过程中,肯定会出现数据孤岛的现象,所以也要关注数据的关联度以及数据清洗等等问题。

其实不管是大数据还是人工智能,从实际应用来看,最终需要达到效率提高的目标。杨辰韵认为,大数据应用的关键在于为正确的人推送正确的有效信息,基于这个大前提,如果现有的一些技术不如上一代技术或者是人工的话,不如弃之不用。衡量技术的标准在于是否创造更多的价值,提升了应用场景的效率。

“至于是大数据、小数据还是样本,我们应该确定企业本身所拥有的原材料数据情况,然后对症下药,不是为了达成某个概念去做这个事情,而是要解决好实际问题。尤其是企业的第一方数据,虽然数据体量相对较小,但是价值非常高。而海量第三方大数据有很多噪音数据和非真实数据,这个情况下它的应用价值并不高。”

结语

大数据已经无处不在,万亿市场留给初创企业的机会很多,关键在于谁能抓到迅速成长的机会,在合理、安全的范围,充分发挥数据的价值。

后续,在业务层面,创略科技也将不断围绕营销和客户生命周期的场景,继续迭代和丰富其智能数据营销产品。

【镁客·请讲】专注于报道科技创新项目;我们敞开心扉面对每一位创业者,力求为您呈现一群鲜活、有性格的品牌和人物;我们倾听创业故事和人生经历、探讨商业模式和行业趋势、对接资本市场和供需双方,以期为产业发展注入新的活力。

欢迎做客【镁客·请讲】,栏目合作请发送邮件至:post@im2maker.com

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
26天前
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
9天前
|
存储 机器学习/深度学习 人工智能
【AI系统】完全分片数据并行 FSDP
本文深入探讨了AI框架中针对权重数据、优化器数据和梯度数据的分布式并行实现,特别是在PyTorch框架下的具体方案。文章首先回顾了通用数据并行和分布式数据并行的概念,重点讨论了同步与异步数据并行的差异。接着,文章详细介绍了如何在PyTorch中实现弹性数据并行,特别是完全分片数据并行(FSDP)的机制,包括其如何通过分片模型状态和剩余状态来减少内存消耗,提高训练效率。此外,文章还探讨了混合精度训练、损失缩放和内存消耗估算等关键技术,为理解和实施高效的分布式训练提供了全面的指导。
28 9
【AI系统】完全分片数据并行 FSDP
|
9天前
|
机器学习/深度学习 人工智能 PyTorch
【AI系统】数据并行
数据并行是一种在分布式AI系统中广泛应用的技术,通过将数据集划分成多个子集并在不同计算节点上并行处理,以提高计算效率和速度。在大规模机器学习和深度学习训练中,数据并行可以显著加快模型训练速度,减少训练时间,提升模型性能。每个计算节点接收完整的模型副本,但处理不同的数据子集,从而分摊计算任务,提高处理速度和效率。数据并行按同步方式可分为同步数据并行和异步数据并行,按实现方式包括数据并行、分布式数据并行、完全分片的数据并行等。其中,分布式数据并行(DDP)是当前应用最广泛的并行算法之一,通过高效的梯度聚合和参数同步机制,确保模型一致性,适用于大型NPU集群和AI系统。
60 7
【AI系统】数据并行
|
7天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
14天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
18天前
|
存储 人工智能 编译器
【AI系统】昇腾数据布局转换
华为昇腾NPU采用独特的NC1HWC0五维数据格式,旨在优化AI处理器的矩阵乘法运算和访存效率。此格式通过将C维度分割为C1份C0,适应达芬奇架构的高效计算需求,支持FP16和INT8数据类型。此外,昇腾还引入了NZ分形格式,进一步提升数据搬运和矩阵计算效率。AI编译器通过智能布局转换,确保在不同硬件上达到最优性能。
42 3
|
29天前
|
人工智能 Cloud Native 算法
|
1月前
|
人工智能 算法 新制造
走进北京科技大学,通义灵码与企业高校共筑 AI 创意课堂
近日,通义灵码有幸参与到一场由伊利集团主办的 AIGC 生态创新大赛路演舞台,与高校专家、企业代表、青年学子共同探讨 AIGC 创意应用,交流企业在数智领域转型、青年开发者科技创新的思路和落地实践。
|
1月前
|
人工智能 自然语言处理 关系型数据库
从数据到智能,一站式带你了解 Data+AI 精选解决方案、特惠权益
从 Data+AI 精选解决方案、特惠权益等,一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践。
|
11天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。