智能媒体管理产品文档转换/预览功能介绍(1)---Cloud Native架构

本文涉及的产品
对象存储 OSS,20GB 3个月
云备份 Cloud Backup,100GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
简介: 办公文档是每个人日常频繁使用的工具,ppt、word、xls、wps、pdf等为我们工作和生活带来了很多的便利,本文介绍在云计算和智能手机时代,基于智能媒体管理的新型Cloud Native文档转换/预览架构,实现高效的

一、导语

办公文档是每个人日常频繁使用的工具,ppt、word、xls、wps、pdf等为我们工作和生活带来了很多的便利,本文介绍在云计算和智能手机时代,基于 智能媒体管理 的新型Cloud Native文档转换/预览架构,实现高效的文档预览服务。

二、背景介绍

构建文档预览服务,需要考虑原始文档的保存,文档传输到转换预览服务器,进行文档格式转换以及数据的保存,对外支撑客户端的预览服务流程,同时需要考虑整个过程中对安全和可靠性的设计。所以,评估文档预览服务,必须要考虑如下的技术点。

2.1 转换引擎

  • 格式种类。分为支持的输入文档种类、输出文件格式,比如输入文档种类支持ppt、pot、pptx、doc、dot、docx、xlsx、csv等,输出文件格式为jpg、png、pdf、向量格式(Vector,该格式支持在预览时选取里面的文字)。
  • 转换效果。能够转换大文件(比如20MB以上的文件),对于xls文件也能够友好的显示(包括sheet的显示)。

2.2 预览技术

  • 多设备支持。在PC/手机上都能轻松预览,支持左右、上下翻页的体验。
  • 定制化能力。提供预览插件框架,可以在预览页面中插入自定义广告。

2.3 安全设计

  • 原始文档的安全。原始文档是否需要上传到其他的应用或者其他的云。
  • 预览数据的安全。经转换引擎生成的预览数据持久化保存位置是否是您可以指定的位置,预览的数据是否支持签名访问。
  • 加密文档的安全。对于加密的文档,是否可以支持预览。

2.4 SLA设计

  • 预览服务的SLA。因为预览是通过互联网为PC/手机提供服务,所以可以按照云服务的标准衡量服务等级。
  • 预览数据的持久度。由于众多的互联网客户端都会访问数据,所以数据的持久度也是一个关键指标。

上述技术点,将是评估文档预览架构的重要评价标准。

三、现有架构

不管是公有云还是专有云,现有典型的文件预览架构是部署专门的预览软件,比如Microsoft OWA(Office Web Apps),以“公有云存储OSS+OWA“为例,其架构如下。

现有架构

其典型特征如下:

  • 转换数据保存在转换/预览服务器。需要在转换/预览服务器提供存储,如果采用本地存储,需要解决该服务器故障时预览不可用的问题;否则,利用这些服务器构建分布式存储,保证服务器故障也能访问数据。
  • 客户端预览请求由转换/预览服务器完成。服务器需要提供预览的互联网带宽、解决重复预览请求的缓存设计,以及根据请求做弹性伸缩的服务能力。

整体来看,这是传统的预览架构,并没有充分利用云存储OSS的互联网访问、弹性伸缩、数据持久度、SLA等能力。

四、Cloud Native架构

智能媒体管理 产品,基于现有架构的分析,优化设计了Cloud Native架构的文档预览服务,其架构如下。

Cloud Native架构

其典型特征是:

  • 充分利用云存储OSS的服务化能力。服务器只需处理文档的格式转换,然后充分利用云存储OSS的互联网访问、弹性伸缩、数据持久度、SLA等能力客户端提供文档浏览服务。
  • 客户端直连OSS进行预览。链路短、效率高、体验好。

五、架构对比

5.1 架构对比分析

通常前面的介绍,现有架构中服务器同时支持转换、预览能力,客户端始终和服务器交互,是典型的In Band模式;而Cloud Native架构充分利用云存储OSS提供预览能力,服务器只需提供转换功能,从而 实现转换、预览解耦,是典型的Out Of Band模式。

架构对比

由于Cloud Native架构的解耦模式,云存储OSS卸载了预览服务,从而和现有架构相比,只需采用更少的转换服务器就可以完成服务; 并且由于转换数据都在OSS上,转换服务器可以采用无状态设计,从而转换服务可以轻易的实现弹性伸缩。

5.2 技术点对比

\ 现有架构(OWA) 智能媒体管理的CloudNative架构
转换格式种类 典型的office文档 office文档、WPS文档、代码等多种格式
转换效果 限制原文件大小 能转换大文件(比如20MB以上的文档),对于xls文件也能够友好的显示(包括sheet的显示)
预览多设备支持 支持 支持,上下翻页、左右翻页
预览定制化能力 不支持 提供插件框架,可以插入自定义的插件,实现预览显示定制化广告
原始文档的安全 复用OSS的安全 复用OSS的安全
预览数据的安全 预览服务器保证安全,工作量大 复用OSS的安全
加密文档的安全 不支持预览加密文档 支持加密文档预览,以及转换数据的安全
预览服务的SLA 预览服务器的SLA设计,工作量大 复用OSS的SLA,达到99.9%
预览数据的持久度 预览服务器的分布式存储设计,工作量大 复用OSS的持久度,达到11个9

5.3 Cloud Native优势总结

5.3.1 成本更优化

  • 更少的服务器。OSS卸载了预览功能后,服务器只需做转换,从而服务器更少。
  • 更少的服务器存储。OSS保存了转换数据,服务器无需使用存储来保存转换数据。

5.3.2 扩展性更优

  • 服务器无状态扩展。无需保存转换数据,故可以采用无状态设计,非常容易实现扩展性。
  • 基于OSS的存储和网络扩展能力。无需基于服务器构建分布式系统,利用OSS实现弹性伸缩。

5.3.3 可靠性更好

  • 直接复用OSS的可用性和持久度。无需基于服务器构建分布式系统,提供高可靠性。

六、如何使用

通过阿里云提供的云存储OSS,以及阿里云的 智能媒体管理 服务,可以直接在您的云存储OSS上快速实现自己的文档预览服务。参考如下的文章,帮助您迅速搭建服务:

  1. 智能媒体管理产品文档转换/预览功能介绍(2)---转换原理
  2. 智能媒体管理产品文档转换/预览功能介绍(3)---预览原理
  3. 智能媒体管理产品文档转换/预览功能介绍(4)--快速搭建
目录
相关文章
|
2月前
|
Kubernetes 调度 算法框架/工具
NVIDIA Triton系列02-功能与架构简介
本文介绍了NVIDIA Triton推理服务器的功能与架构,强调其不仅适用于大型服务类应用,还能广泛应用于各类推理场景。Triton支持多种模型格式、查询类型和部署方式,具备高效的模型管理和优化能力,确保高性能和系统稳定性。文章详细解析了Triton的主从架构,包括模型仓库、客户端应用、通信协议和推理服务器的核心功能模块。
91 1
NVIDIA Triton系列02-功能与架构简介
|
2月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
241 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
29天前
|
机器学习/深度学习 存储 人工智能
政务部门人工智能OCR智能化升级:3大技术架构与4项核心功能解析
本项目针对政务服务数字化需求,建设智能文档处理平台,利用OCR、信息抽取和深度学习技术,实现文件自动解析、分类、比对与审核,提升效率与准确性。平台强调本地部署,确保数据安全,解决低质量扫描件、复杂表格等痛点,降低人工成本与错误率,助力智慧政务发展。
|
2月前
|
机器学习/深度学习 存储 搜索推荐
NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用
NVIDIA Ampere架构引入了结构化稀疏功能,显著加速了深度学习模型的推理过程。通过2:4的稀疏模式,即每4个相邻权重中有至少2个为0,实现了高效的内存访问和模型推理加速,同时保持了模型精度。腾讯机器学习平台部门利用这一特性,通过渐进式训练方法,实现了模型在搜索引擎中的高效部署与应用,如相关性预测、查询性能预测等场景,不仅提升了处理速度,还在某些情况下超过了原有模型的精度。此外,NVIDIA还提供了TensorRT和cuSPARSELt库,进一步增强了稀疏模型的推理效率。
33 0
 NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用
|
1月前
|
数据管理 Nacos 开发者
"Nacos架构深度解析:一篇文章带你掌握业务层四大核心功能,服务注册、配置管理、元数据与健康检查一网打尽!"
【10月更文挑战第23天】Nacos 是一个用于服务注册发现和配置管理的平台,支持动态服务发现、配置管理、元数据管理和健康检查。其业务层包括服务注册与发现、配置管理、元数据管理和健康检查四大核心功能。通过示例代码展示了如何在业务层中使用Nacos,帮助开发者构建高可用、动态扩展的微服务生态系统。
110 0
|
3月前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
185 9
|
4月前
|
Cloud Native
云原生架构之X无限延伸:跨AZ、跨Region、跨Cloud,一文让你彻底解锁!
【8月更文挑战第25天】在云原生架构中,可扩展性至关重要,它确保了应用能按需高效调整资源。本文聚焦于三种扩展策略:跨AZ、跨Region及跨云扩展。跨AZ扩展通过在同一云内部不同可用区间部署应用副本增强容错性;跨Region扩展则通过不同地理区域的应用副本部署提升全球访问性能与可靠性;而跨云扩展则利用多云环境进一步加强应用的弹性和覆盖范围。文中提供了基于AWS CloudFormation的具体实践示例,帮助读者深入理解这些扩展机制的实际应用。
160 2
|
4月前
|
Cloud Native
核心系统转型问题之平衡核心架构中的功能性与非功能性需求如何解决
核心系统转型问题之平衡核心架构中的功能性与非功能性需求如何解决
|
5月前
|
负载均衡 监控 Kubernetes
Service Mesh 是一种用于处理服务间通信的基础设施层,它通常与微服务架构一起使用,以提供诸如服务发现、负载均衡、熔断、监控、追踪和安全性等功能。
Service Mesh 是一种用于处理服务间通信的基础设施层,它通常与微服务架构一起使用,以提供诸如服务发现、负载均衡、熔断、监控、追踪和安全性等功能。
|
5月前
|
消息中间件 Java 开发者
Spring Cloud微服务框架:构建高可用、分布式系统的现代架构
Spring Cloud是一个开源的微服务框架,旨在帮助开发者快速构建在分布式系统环境中运行的服务。它提供了一系列工具,用于在分布式系统中配置、服务发现、断路器、智能路由、微代理、控制总线、一次性令牌、全局锁、领导选举、分布式会话、集群状态等领域的支持。
199 5

相关产品

  • 智能媒体管理