用户身份标识与账号体系实践

简介: 用户身份的全局统一标识至关重要,用户实体在不同业务线所产生的行为数据,通过唯一序列号进行识别,这样进行用户分析时看到的画像比较全面;
互联网的账号自带备忘机制;

一、业务背景

通常在系统研发的过程中,需要不断适配各种业务场景,扩展服务的领域和能力,一般会将构建的产品矩阵划分出多条业务线,以便更好的管理;

由于各个业务线的数据入口和管理策略的不同,这样从不同路径下沉淀的数据,可能因为系统边界问题从而被孤立;如果用户数据被分裂,会因为数据不全面给分析决策带来误导;

比较经典的场景,用户从应用端完成注册之后,通常不会过多提供自身信息,由于业务需要不断丰富用户画像,所以用户数据通常会被调度到独立的管理系统中,通过不同的触点反馈进行信息扩展,比如采集埋点数据,线下接触,营销电话等;

06-1.png

这种情况从操作上是有明显感知的场景,显然用户在应用库中的数据和在管理库是存在很大差异的,在真实的情况中用户可能在不同的应用和场景中会产生重复,必然会导致用户数据难以统一维护;

二、唯一标识

用户的行为数据在当下的互联网产品中,是极其具有分析价值的,不同的应用端不管是否处于登录状态,在产品中产生的数据都是有记录的手段,进而在数据层面分析识别;

06-2.png

这些编号最大的特点就是具有唯一性,可以标识用户在不同终端不同状态的操作信息,而当这些数据沉淀到系统时,会根据端口和操作类型进行存储,不同的终端下其数据唯一标识也不相同;

从数据分析的角度上来看,显然不希望用户的行为信息被分裂并且各自孤立,这样对多终端多状态下的用户行为数据进行全域关联,是行之有效的方式,其基本原理涉及到ID的映射技术;

三、Id映射

基于上述的业务情况,在产品矩阵中提供用户身份的全局统一标识至关重要,用户实体在不同业务线所产生的行为数据,通过唯一序列号进行识别,这样进行用户分析时看到的画像比较全面;

06-3.png

在当下的互联网产品中,基于手机号创建应用账号的模式已经是常见功能,手机号注册之后,再通过手机号去关联相应的终端ID,从而使各种孤立的数据被链接起来;

其实现的原理并不复杂,首先需要提供一套映射库,当新的手机号被系统识别采集时,在映射库中新建一条数据,手机号和对应的唯一ID,此后其他路径的数据,如果手机号相同则绑定在该ID下面;

四、数据关联

在ID映射机制下,虽然各个业务线数据相对孤立,数据之间不会产生直接影响,但是实际上已经被唯一ID串联起来,这样将ID关联的数据进行综合分析,准确性会提高很多;

06-4.png

不管从任何路径或渠道下采集的数据,如果存在手机号的维度,或者手机号相关联的序列号标识,判断该手机号是否存在全局映射ID,没有则在映射库中创建对应关系,如果有则直接绑定即可;

在执行数据的全局调度和分析时,则通过映射库的标准关系,基于ID标识将全部业务线的数据进行查询和统筹分析,从而生成相对全面的数据档案,以及标准的分析逻辑;下面给出一个参考性的结构设计:

06-5.png

这里存在数据关联的逻辑,ID标识与手机号都是唯一的且一对一,但是手机号与终端的序列号可能存在一对多,甚至是多对多;账号与应用中产生的行为数据,虽然追求准确性,但是精确度不会过度要求;

这种情况下就需要执行相应的业务策略,比如同一个手机号可能登录过不同手机中的相同应用,手机中的应用也可能被多个账号登录过,此时则需要基于策略做关联上的取舍,可能是账号登录时长,或者登录前后的时段,无法一概而论;

五、注册登录

以手机号作为账号主体为例,开放的应用并不会明显区别注册和登录,以此简化操作避免阻断掉用户,在通过手机号登录时,如果是未注册的用户直接进行信息初始化即可;

06-6.png

  • 用户在登录表单中,输入手机号并获取验证码;
  • 在登录服务中,生成并维护验证码的时效;
  • 验证码需要借助对接的第三方短信平台推送到用户手机中;
  • 登录表单填充验证码之后提交登录信息进行验证;
  • 当登录验证成功之后,如果用户未注册则初始化账号体系;
  • 账号体系校验和维护之后,通过异步方式关联ID标识;
  • 最后需要给用户端返回Token身份令牌,作为账号识别;

注册登录集成在一起的复用接口比较复杂,但是以最短的路径让用户快速使用产品,通过行为数据采集分析,从而可以精准识别用户需求,进行正确的引导和营销,发挥出数据的真正价值;

06-7.png

这里给出一份账号管理的结构设计参考,通常情况下用户的主表维度会围绕可登录的账号来设计,而涉及到信息采集的数据会写入用户档案表,由于不同业务场景对信息依赖不同,所以在用户注册之后会引导各种数据采集的页面;

用户身份识别和账号作为系统非常基础的核心能力,在设计的时候既要有用户体验,同时要重视数据的安全性;作为核心能力在前期设计的时候就需要一定的前瞻性,做好可能性的规划和结构预留,避免后续的迭代跨度过大。

END


相关文章
|
人工智能 并行计算 openCL
魔搭+Xinference 平台:CPU,GPU,Mac-M1多端大模型部署
随着 Llama2 的开源,以及通义千问、百川、智谱等国内大模型的问世,很多用户有了本地部署去尝试大模型的需求,然而硬件的需求阻碍了很多人的尝试,并不是所有人都拥有一块英伟达显卡的,所以 Llama2 问世不久,大神 Andrej Karpathy 的一个 weekend project 爆火——llama2.c。
魔搭+Xinference 平台:CPU,GPU,Mac-M1多端大模型部署
|
SQL 分布式计算 DataWorks
MaxCompute最佳实践:SQL实现一行变多行&多行变一行
本文对Dataworks里一行变多行&多行变一行进行实践,其中多行变一行是对现有实践的一个引用,方便大家查找
|
弹性计算 运维 安全
不得不懂的阿里云账号体系
很多云参与者,并不了解云上账号体系,但了解云账号体系是云采用的基础,本文就带你全面了解阿里云账号体系,适用于所有云参与者。
1465 3
|
运维 监控 安全
身份是安全的基石:深入理解阿里云身份体系
企业云上身份管理面临诸多挑战,如账号泄露、权限未及时回收等,导致数据泄露和内部系统被篡改。阿里云提供了一套完善的身份管理体系,包括单账号和多账号场景下的解决方案。对于单账号,通过主账号保护、RAM用户和角色实现分权与审计;对于多账号,使用云SSO统一管理和配置跨账号权限,确保安全合规。该体系支持浏览器、API访问,并集成企业IDP,实现无密钥登录和自动化管理,有效降低风险并提高管理效率。
|
存储 数据处理 对象存储
云端问道方案教学4期—多媒体数据存储与分发
本文整理自阿里云存储服务产品团队关于多媒体数据存储与分发的分享,涵盖以下四部分内容:1)行业痛点及背景:分析Web 2.0到AIGC时代下多媒体行业的存储挑战;2)方案优势介绍:结合对象存储(OSS)、智能媒体管理(IMM)和内容分发网络(CDN),提供高效、低成本的解决方案;3)典型场景应用:包括音视频、在线教育、网站/APP/小程序、游戏下载等场景的具体应用;4)选型推荐:根据业务需求选择合适的产品配置。该方案通过动静分离、智能处理和全球加速,帮助企业在数据存储与分发中实现降本增效。
359 2
|
存储 SQL 关系型数据库
MySQL8.0新特性与旧特性移除总结
MySQL从5.7版本直接跳跃发布了8.0版本 ,可见这是一个令人兴奋的里程碑版本。MySQL 8版本在功能上做了显著的改进与增强,开发者对MySQL的源代码进行了重构,最突出的一点是对MySQL Optimizer优化器进行了改进。不仅在速度上得到了改善,还为用户带来了更好的性能和更棒的体验。
1042 1
|
JSON API 开发工具
淘宝实时 API 接口丨淘宝商品详情接口(Taobao.item_get)
淘宝商品详情接口(Taobao.item_get)允许开发者获取商品的详细信息,包括基本信息、描述、卖家资料、图片、属性及销售情况等。开发者需注册账号、创建应用并获取API密钥,通过构建请求获取JSON格式数据,注意遵守平台规则,合理使用接口,确保数据准确性和时效性。
1303 9
|
算法 JavaScript
JS【详解】时间复杂度
JS【详解】时间复杂度
323 1
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之如何删除已有表中的单个字段
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
419 1
|
机器学习/深度学习 人工智能 自然语言处理
如何利用Python实现简单的自然语言处理
本文将介绍如何使用Python编程语言实现简单的自然语言处理(NLP)任务。我们将探讨NLP的基本概念,包括文本预处理、词袋模型和简单的情感分析。通过实例代码和解释,读者将能够理解如何利用Python中的常用库来实现这些功能,为进一步学习和探索NLP打下坚实的基础。

热门文章

最新文章