DaaS架构及落地 (一)

简介: DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。

1. 序言

DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。

本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。

2. 基础架构

系统由四部分组成,包括:

  • 客户基于 API 自研应用,从而实现访问数据的目的。
  • API 为数据接口,封装和抽象了数据的定义和许可的数据访问模式。
  • 数据服务是 API 功能的具体实现。
  • 数据库则存储了原始的数据,当然还有非结构化的数据,如一些图片、视频、专有文件等。

这种架构适合两种情况,一是可信的环境内,二是前期的商业验证阶段,优势是结构简单,实施成本低。

3. +官方应用

很多情况下,客户没有应用开发能力,需要接口上叠加一个轻量级的图形化工具,比如网页、小程序。

4. +应用认证

增加 App认证鉴权之后,能缓解对于API 接口安全的焦虑。借助线下、线上的授权,许可特定的应用来访问特定的接口。

5. +模型

基于对于应用场景的理解,将原始数据进行一定的加工,生成模型数据(间接数据),对外提供模型数据。这将简化客户 app 的开发,同时也在一定程度上保护了原始数据。

6. +脱敏

一些数据不能直接对外,需要一些脱敏处理,可以采用动态脱敏或者静态脱敏。动态脱敏是访问时现进行计算,静态脱敏则是提前完成。

7. +库内计算

传统数据库提供了一些计算能力,比如常见的统计函数、存储过程等。现在的新型数据库的算力越来越强,与其将数据传来传去,受限于带宽,还不如把计算下放到数据库中。同时,这也减少了出库的数据,降低了数据安全风险。

8. +计费

计费有很多种方式,这里提两种,一是在 api 层同步或异步进行计费业务,另一种则是以离线的统计日志数据,生成费用。前者计费及时些,但对于工程能力要求高,同时也会造成接口访问效率的降低;后者系统更健壮,但存在滞后问题,这也可以通过商业措施来解决。

9. +开发

当考虑到开发场景,会增加其他的需求,比如测试环境、生产环境,比如 SDK、开发文档。但最考验技术的还是接口的版本问题。

推荐

阿里云 API 网关是个非常好的学习对象,对于想实现一个 DaaS 系统的朋友,其有很好的借鉴意义。当然与其重复造个轮子,不如享用当下成型的产品,将精力聚焦于核心业务的开发中。

思考

  • 如何做访问加速?
  • 如何做高可用?
  • 如何做弹性?
  • 隐私计算、联邦学习、多方安全计算、可信计算、机密计算是什么?
  • 引入这些之后,DaaS架构会如何演进呢?



目录
相关文章
|
SQL 分布式计算 数据管理
12款开源数据资产(元数据)管理平台选型分析(一)
12款开源数据资产(元数据)管理平台选型分析(一)
4035 2
|
Cloud Native Linux 网络安全
如何利用Gitlab-CI持续部署到远程机器?
长话短说,今天聊一聊使用Gitlab-CI 自动部署到远程服务器。
如何利用Gitlab-CI持续部署到远程机器?
|
机器学习/深度学习 敏捷开发 存储
数据飞轮:激活数据中台的数据驱动引擎
数据飞轮:激活数据中台的数据驱动引擎
|
SQL 存储 数据挖掘
Dremio架构分析
一.Dremio架构 Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
9920 0
|
10月前
|
人工智能 自然语言处理 关系型数据库
从数据到智能,一站式带你了解 Data+AI 精选解决方案、特惠权益
从 Data+AI 精选解决方案、特惠权益等,一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践。
|
10月前
|
缓存 Linux Docker
【最新版正确姿势】Docker安装教程(简单几步即可完成)
之前的老版本Docker安装教程已经发生了变化,本文分享了Docker最新版安装教程,其他操作系统版本也可以参考官 方的其他安装版本文档。
10193 3
【最新版正确姿势】Docker安装教程(简单几步即可完成)
|
9月前
|
JavaScript 前端开发
捕获键盘输入和输入组合键的js库hotkeys
捕获键盘输入和输入组合键的js库hotkeys
|
机器学习/深度学习 分布式计算 大数据
|
数据采集 人工智能 数据挖掘
【钉钉杯大学生大数据挑战赛】初赛B 航班数据分析与预测 Python代码实现Baseline
本文提供了参加"钉钉杯大学生大数据挑战赛"初赛B的航班数据分析与预测项目的Python代码实现Baseline。内容包括题目背景、思路分析、训练集和测试集的预处理、模型训练与预测、特征重要性分析,以及代码下载链接。预处理步骤涉及读取数据、时间信息处理、前序航班延误时间计算、天气信息匹配等。模型训练使用了Gradient Boosting Classifier,并对模型的准确率和特征重要性进行了评估。
253 0
|
数据采集 存储 监控
谈谈从DAMA、DCMM和DGI三大数据治理框架详细了解数据战略规划的关键要素
当前,数据作为新的生产要素提到了关键位置,众多组织认为数据是重要的战略资产。
谈谈从DAMA、DCMM和DGI三大数据治理框架详细了解数据战略规划的关键要素