开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:客户分享:PAI 在亲宝宝的业务应用】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/855/detail/14137
客户分享:PAI 在亲宝宝的业务应用
APP简介
亲宝宝 app 在2013年上线,定义亲宝宝为新一代家庭育儿方式,使命就是运用科技力量,帮助家庭更好关爱和培养孩子。目前,亲宝宝一共扩展了6个主要业务:
(1) 成长记录
(2) 智能育儿助手
(3) 自由商品品牌
(4) 早教课程
(5) 品牌广告
(6) 智能硬件
数据上,已经累积了1亿以上注册用户,达到了2,000万以上访问量,日均文件传输超过了1,000万,服务超过了5,000万以上家庭,5,000万个年轻家庭中,用户分布以妈妈为主,其次爸爸和祖辈,在以宝宝为纽带,构成了整个app用户画像基础,在基础上做不同运营策略,例如中国家庭隔代育儿现象较为普遍,目前祖辈智能手机普及率也较高,针对性推送相关内容,帮助接收科学育儿理念。
以下是亲宝宝如何完成个性化推荐以及用户画方案的方式:新宝宝以 max computer 计算和存储能力为依托构建了整个大数学电路,数据员包括了 APP 埋点,Nginx cdn 使用阿里云日志服务、流计算、函数计算、dts等,将数据导入到 max computer 中,在 max computer 进行数据加工,在该基础上快速构建用户圈选,BI 报表,机器学习和个性化推荐等相关应用。亲宝宝基于 max computer+PAI 来构建用户画像和家庭画像服务,包括了从数据加工以及策略标签管理与用户家庭画像开发了智能营销系统 ims,结合画像数据,一方面可以针对宝宝在成长过程中发育特点,推送小报,育儿知识等内容,做个性化科学育儿指导;另一方面,结合用户家庭对品牌偏好,精准投放广告,方案上使用了max computer 加工标签,以 PETER MAP 方式存储到 PG 数据库,实现快速高效用户圈选,基于阿里云max computer、EM8、计算、oss 等产品搭建了个性化推荐系统,以下为典型个性化推荐系统框架结构:
最后通过用户行为反馈,对模型和策略做不断迭代,从收益上来看,可以提升轻薄优品30%以上UV价值以及50%以上点击率,新词小报,可以提升60%以上阅读时长和50%左右的点击率,成长记录是 APP 的核心业务,用户每天上传了许多照片和视频,如何帮助用户更好管理照片视频,在图像和视频领域,进行了很多探索和尝试,希望通过机器学习技术手段,帮助产品进行演进,以下为在图像和视频领域部署的相关应用:
在服务端有人员检测、敏感内容分析、表情识别、文字检测与识别等,服务端每天要处理千万级别照片以及百万级别视频,需要消耗巨大资源,所以把服务部署在 service,可以弹性扩容,节省了50%以上费用,另外在客户端为了帮助用户更快捷方便的一键上传照片,针对儿童人特点,开发了人脸检测,年龄检测,图像质量分析等。SDK为了解决性能和模型 room size 问题,采用了 ncn 框架,后来阿里有推出过 mn 框架,以下为应用实例:
在检测到家庭合照以后,合适时机生成 MV 推送给用户,通过以上图和视频技术,业务有极大提升,新用户文件上传量超过了90%,MV 点击率提高了60%,对于育儿助手模块,基于用户画像,针对宝宝的特点,提供个性化育儿指导,除了个性化育儿指导,还开发了智能问答系统,以下为系统方案:
让用户育儿问题通过机器分类,分发给 kol、运营或智能育儿助手来回答,可以借助 nlp 技术,并结合用户画像信息,实现高效并科学回答用户提问。问答系统,完成了1,000多个知识点,近20万以上语调标注,准确率控制在95%以上。app 深受用户好评,亲宝宝在机器学习技术和应用具有强烈好奇心和愿望,希望通过积极学习技术,帮助年轻家庭更好关爱和培养孩子,希望阿里云能够推出更多更好产品,拓展在积极学习应用边界。