《云上社交行业技术服务白皮书》——第三章 云上社交典型场景与架构——3.2 细分领域社交——3.2.1 母婴场景(下)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 《云上社交行业技术服务白皮书》——第三章 云上社交典型场景与架构——3.2 细分领域社交——3.2.1 母婴场景(下)

《云上社交行业技术服务白皮书》——第三章 云上社交典型场景与架构——3.2 细分领域社交——3.2.1 母婴场景(上) https://developer.aliyun.com/article/1232380?groupCode=supportservice


3.2.1.2.2 某母婴平台所特有的两个大数据


说到大数据,其实这是一个耳熟能详的话题,很多人都非常熟悉,下面从两个方 面介绍母婴平台所特有的两个大数据。


1、关于妈妈的核心生育数据。什么是生育数据?你当前怀孕多少天了,然后宝 宝什么时候出生,预产期是什么时候,宝宝当前多大了,我们是可以精确到天的,然 后这个数据是非常准确的。其实我们每天都会有很多宝妈用户现在正在产房里,等待 生命的诞生。然后我们明天也会看到他们很多的报喜帖,其实基于用户的一种真实的 运营数据,我们是不需要猜测对吧?我们就可以非常精准的知道在这样一个阶段,用 户需求是什么,然后有针对性的去满足她们,通过一些产品或者服务。


2、社区有非常海量的UGC内容加PGC内容,然后用户在这些内容上的行,还 有用户之间的互动,让积累了海量的行为数据。这种行为数据不是一种泛领域的,而 是母婴领域的,那么这里面有很多不是泛领域能够解决的一些问题,包括妈妈之间的 一些讨论等等。基于核心生育和行为数据,精准秒回用户画像,优化用户体验,提升化效率。


image.png


根据这两大核心数据,可以构建一个非常完整的也是非常全面的某一领域的画像 体系。基于这个画像体系,第一个会非常好的去服务我们的最大用户,也就是宝妈人 群,第二个对于的B端客户也是有巨大的价值,一个是提升整个商业投放的效率、化率等,另外一个就是可以通过反向的数据驱动,可以发现更多用户的潜在需求,那 么这对B端客户的营销有着巨大的商业价值。

 

3.2.1.2.3 母婴社交云上大数据仓库


某母婴平台作为中国最大、最活跃的母婴类社区平台。作为最早做互联网2C 社区平台之一,其很早就建立了自己的IDC集群,而且规模越来越大。


早期该母婴平台使用的是自建的大数据体系,从数据的产生,数据的传输、存 储、计算,然后到整个数据服务,再到整个上层的应用,包括BI报表以及数据分析工 具等,根据其集群水位高,性能差,亟待大数据综合治理以及IDC大数据每年投入成 本高,希望降本提效的多重需求下,从大数据平台上云整体“降本增效”的方案快速 切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍上的性提升,  存储从自建Hadoop13PB降到900T,  利用Flink实时数据处理能力, 将该母婴平台现有的场景实时化(“基于用户ID维度和内容类型的实时行为”、“获取 用户的实时群聊ID及“获取文章的实时发布信息”),并且基于Flink进行实时推荐增加转化率。大数据平台整体成本节省30%以上。


image.png


使用阿里云的一些技术,总结起来,其实主要是有几点收益:


image.png

1、从成本角度,从硬件、运维以及整个操作的成本综合评估下来,  可以节省 40%左右。


2、从产品角度,因为采用了阿里云大数据技术栈,这些技术栈对开发者来说还 是非常友好的,使很多开发者长期以来面临的痛点得到了实际的解决,实现了超大规 时,离线计算和数据治理,比如前面说的DataWorks一站式开发平台,就对开 率有着显著的提升;


3、从云计的底层来说,该平台可以很好的享受它的一些安全性,整个弹性、 可伸缩性等。因为业务流量有时也会突增,在这种场景下是能够天然的享受到云服务 好处。例如该母婴平台对GPU的使用,以前都需要自己进行购买,现在可以按需 使用阿里云的GPU,在技术的使用效率上有了很大的提升。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
18天前
|
机器学习/深度学习 安全 算法
十大主流联邦学习框架:技术特性、架构分析与对比研究
联邦学习(FL)是保障数据隐私的分布式模型训练关键技术。业界开发了多种开源和商业框架,如TensorFlow Federated、PySyft、NVFlare、FATE、Flower等,支持模型训练、数据安全、通信协议等功能。这些框架在灵活性、易用性、安全性和扩展性方面各有特色,适用于不同应用场景。选择合适的框架需综合考虑开源与商业、数据分区支持、安全性、易用性和技术生态集成等因素。联邦学习已在医疗、金融等领域广泛应用,选择适配具体需求的框架对实现最优模型性能至关重要。
250 79
十大主流联邦学习框架:技术特性、架构分析与对比研究
|
2月前
|
Kubernetes Cloud Native 微服务
探索云原生技术:容器化与微服务架构的融合之旅
本文将带领读者深入了解云原生技术的核心概念,特别是容器化和微服务架构如何相辅相成,共同构建现代软件系统。我们将通过实际代码示例,探讨如何在云平台上部署和管理微服务,以及如何使用容器编排工具来自动化这一过程。文章旨在为开发者和技术决策者提供实用的指导,帮助他们在云原生时代中更好地设计、部署和维护应用。
|
14天前
|
机器学习/深度学习 缓存 自然语言处理
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
DeepSeekMoE是一种创新的大规模语言模型架构,融合了专家混合系统(MoE)、多头潜在注意力机制(MLA)和RMSNorm归一化。通过专家共享、动态路由和潜在变量缓存技术,DeepSeekMoE在保持性能的同时,将计算开销降低了40%,显著提升了训练和推理效率。该模型在语言建模、机器翻译和长文本处理等任务中表现出色,具备广泛的应用前景,特别是在计算资源受限的场景下。
296 29
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
|
2月前
|
监控 安全 API
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型,实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性,为机器学习工程师和研究人员提供了系统化的技术方案。
202 77
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
|
11天前
|
机器学习/深度学习 算法 文件存储
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
37 10
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
|
7天前
|
机器学习/深度学习 算法 文件存储
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
19 4
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
|
23天前
|
存储 缓存 关系型数据库
社交软件红包技术解密(六):微信红包系统的存储层架构演进实践
微信红包本质是小额资金在用户帐户流转,有发、抢、拆三大步骤。在这个过程中对事务有高要求,所以订单最终要基于传统的RDBMS,这方面是它的强项,最终订单的存储使用互联网行业最通用的MySQL数据库。支持事务、成熟稳定,我们的团队在MySQL上有长期技术积累。但是传统数据库的扩展性有局限,需要通过架构解决。
62 18
|
1月前
|
监控 JavaScript 数据可视化
建筑施工一体化信息管理平台源码,支持微服务架构,采用Java、Spring Cloud、Vue等技术开发。
智慧工地云平台是专为建筑施工领域打造的一体化信息管理平台,利用大数据、云计算、物联网等技术,实现施工区域各系统数据汇总与可视化管理。平台涵盖人员、设备、物料、环境等关键因素的实时监控与数据分析,提供远程指挥、决策支持等功能,提升工作效率,促进产业信息化发展。系统由PC端、APP移动端及项目、监管、数据屏三大平台组成,支持微服务架构,采用Java、Spring Cloud、Vue等技术开发。
|
1月前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
1月前
|
负载均衡 Serverless 持续交付
云端问道9期实践教学-省心省钱的云上Serverless高可用架构
详细介绍了云上Serverless高可用架构的一键部署流程
57 10

热门文章

最新文章