DaaS架构及落地 (一)

简介: DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。

1. 序言

DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。

本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。

2. 基础架构

系统由四部分组成,包括:

  • 客户基于 API 自研应用,从而实现访问数据的目的。
  • API 为数据接口,封装和抽象了数据的定义和许可的数据访问模式。
  • 数据服务是 API 功能的具体实现。
  • 数据库则存储了原始的数据,当然还有非结构化的数据,如一些图片、视频、专有文件等。

这种架构适合两种情况,一是可信的环境内,二是前期的商业验证阶段,优势是结构简单,实施成本低。

3. +官方应用

很多情况下,客户没有应用开发能力,需要接口上叠加一个轻量级的图形化工具,比如网页、小程序。

4. +应用认证

增加 App认证鉴权之后,能缓解对于API 接口安全的焦虑。借助线下、线上的授权,许可特定的应用来访问特定的接口。

5. +模型

基于对于应用场景的理解,将原始数据进行一定的加工,生成模型数据(间接数据),对外提供模型数据。这将简化客户 app 的开发,同时也在一定程度上保护了原始数据。

6. +脱敏

一些数据不能直接对外,需要一些脱敏处理,可以采用动态脱敏或者静态脱敏。动态脱敏是访问时现进行计算,静态脱敏则是提前完成。

7. +库内计算

传统数据库提供了一些计算能力,比如常见的统计函数、存储过程等。现在的新型数据库的算力越来越强,与其将数据传来传去,受限于带宽,还不如把计算下放到数据库中。同时,这也减少了出库的数据,降低了数据安全风险。

8. +计费

计费有很多种方式,这里提两种,一是在 api 层同步或异步进行计费业务,另一种则是以离线的统计日志数据,生成费用。前者计费及时些,但对于工程能力要求高,同时也会造成接口访问效率的降低;后者系统更健壮,但存在滞后问题,这也可以通过商业措施来解决。

9. +开发

当考虑到开发场景,会增加其他的需求,比如测试环境、生产环境,比如 SDK、开发文档。但最考验技术的还是接口的版本问题。

推荐

阿里云 API 网关是个非常好的学习对象,对于想实现一个 DaaS 系统的朋友,其有很好的借鉴意义。当然与其重复造个轮子,不如享用当下成型的产品,将精力聚焦于核心业务的开发中。

思考

  • 如何做访问加速?
  • 如何做高可用?
  • 如何做弹性?
  • 隐私计算、联邦学习、多方安全计算、可信计算、机密计算是什么?
  • 引入这些之后,DaaS架构会如何演进呢?



目录
相关文章
|
8月前
|
人工智能 自然语言处理 算法
提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍
LangChain作为主流大语言模型应用框架,其高级组件常被忽视。本文详解10个高价值但低使用率的核心组件,如语义检索、多模板路由、智能查询转换等,结合技术原理与实践案例,助开发者构建更高效、智能、适应性强的AI系统,提升应用性能与业务价值。
564 0
|
负载均衡 Ubuntu 应用服务中间件
|
存储 SQL 缓存
Hadoop入门(一篇就够了)
Hadoop入门(一篇就够了)
37817 4
Hadoop入门(一篇就够了)
|
Cloud Native Linux 网络安全
如何利用Gitlab-CI持续部署到远程机器?
长话短说,今天聊一聊使用Gitlab-CI 自动部署到远程服务器。
如何利用Gitlab-CI持续部署到远程机器?
|
8月前
|
SQL 数据采集 数据处理
终于有人把数据架构讲清楚了!
本文深入浅出地解析了数据架构的核心逻辑,涵盖其定义、作用、设计方法及常见误区,助力读者构建贴合业务的数据架构。
|
8月前
|
机器学习/深度学习 人工智能 算法
Google DeepMind新产物: 行星级卫星嵌入数据集(10m)光学+雷达+DEM+climate...
Google 推出 Earth Engine 卫星嵌入数据集,利用 AI 将一年的多源卫星数据压缩至每个 10 米像素,实现高效地理空间分析。基于 AlphaEarth Foundations 模型,该数据集提供 64 维嵌入向量,支持相似性搜索、变化检测、自动聚类和精准分类,助力环境研究与应用。
519 0
|
SQL 存储 HIVE
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
本文整理自鹰角网络大数据开发工程师朱正军在Flink Forward Asia 2024上的分享,主要涵盖四个方面:鹰角数据平台架构、数据湖选型、湖仓一体建设及未来展望。文章详细介绍了鹰角如何构建基于Paimon的数据湖,解决了Hudi入湖的痛点,并通过Trino引擎和Ranger权限管理实现高效的数据查询与管控。此外,还探讨了湖仓一体平台的落地效果及未来技术发展方向,包括Trino与Paimon的集成增强、StarRocks的应用以及Paimon全面替换Hive的计划。
1717 1
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
|
人工智能 移动开发 自然语言处理
什么是MaaS
MaaS(模型即服务)是一种以AI模型为核心的服务模式,提供从预训练、调优到部署的全生命周期支持。用户能低成本访问和集成先进AI模型,提升业务智能化。其核心特点包括模型为中心、灵活部署、成本优化及开放生态。应用场景涵盖智能客服、交通管理和移动应用开发等,助力企业快速实现智能化转型。
7727 2

热门文章

最新文章