智能媒体管理产品文档转换/预览功能介绍(2)---转换原理

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 智能媒体管理产品提供了 Cloud Native 架构的文档转换/预览服务,本文介绍其中的转换原理和使用方法。

一、导语

智能媒体管理产品 提供了 Cloud Native 架构的文档转换/预览服务,本文介绍其中的转换原理和使用方法。

二、转换原理

正常情况下,文档需要专门的应用才能够打开进行浏览,比如 PPT 、DOC 、XLS 文档需要 OFFICE 应用打开,PDF 文档需要 Adobe 应用打开,并且可以进行编辑。
但现实生活中,大量的场景只需要浏览文档的内容,特别是智能终端时代,能够在浏览器里面预览文档就能实现信息的共享,就能满足绝大部分要求。
为了实现浏览器中预览文档内容,需要将文档进行格式转换(也就是业界常说的转码),转码后的内容就可以在浏览器中查看。

转换原理

如上图所示,智能媒体管理产品 提供的文档转换服务是部署在云端,并且和云存储 OSS 同区域 就近部署,从而降低访问时延,并提升您预览的体验,同时也避免跨区域访问带来的额外费用。

2.1 转换过程

2.1.1 读取云存储 OSS 数据到转换服务

开通智能媒体管理产品 后,客户授权文档转换服务读取 OSS 的权限,基于该权限转换服务将 OSS 文档读取到内存中,启动转换。

2.1.2 解析原文档内容,基于文件格式分析进行转换

比如 OFFICE 文件格式 就提供了 Word、Excel 和 PowerPoint 的格式定义,通过解析内容,在内存中按输出格式生成转换文件。

2.1.3 将格式转换文件写到云存储 OSS

后续的预览请求,将直接读取 OSS 的数据。

2.2 转换规格

2.2.1 支持的原文件格式

演示文件(11种)。pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm 类型文件。
表格文件(10种)。xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm 类型文件。
文字文件(8种)。doc、dot、wps、wpt、docx、dotx、docm、dotm 类型文件。
其他格式文件(19种)。pdf、lrc、c、cpp、h、asm、s、java、asp、bat、bas、prg、cmd、rtf、txt、log、xml、htm、html 类型文件。

2.2.2 转换目标文件类型

1) VECTOR (向量)模式 ,需要使用对应的 Java Script 渲染引擎进行预览。
2) JPG 模式 ,按页生成 JPG 格式的图片。
3) PNG 模式 ,按页生成 PNG 格式的图片。
4) PDF 模式 ,生成一个PDF文件。

2.2.3 目标文件在 OSS 保存的命名规则

1) VECTOR 模式的命名规则
在转换目标文件类型为向量模式时,某 ppt 文档的输出如下图所示。

VECTOR规则

它的所有内容会保存在你指定位置的 doc 目录下,其中 meta.json 为整个文档的信息,fp1.json~fp6.json 表示转换出来的第一页到第六页的信息,I 子目录下的1~14文件表示向量模式下的对象信息。
然后前端使用 Java Script 渲染引擎完成预览,此模式下可以在浏览器中选择文字。

2) JPG 模式的命名规则
在转换目标文件类型为 JPG 模式时,某 ppt 文档的输出如下图所示。

JPG规则

它直接将 ppt 转换为 1.jpg~6.jpg 共6张图片,从而浏览器可以直接浏览 JPG 文件。

3) PNG 模式的命名规则
在转换目标文件类型为 PNG 模式时,某 ppt 文档的输出如下图所示。

PNG规则

它直接将 ppt 转换为 1.png~6.png 共6张图片,从而浏览器可以直接浏览 PNG 文件。

4) PDF 模式的命名规则
在转换目标文件类型为PDF模式时,某 ppt 文档的输出如下图所示。

PNG规则

它直接将 ppt 转换为 pdf 文件,从而浏览器可以直接预览、打印该文件。

三、API介绍

通过直接调用智能媒体管理服务的 文档格式转换 API 完成文档格式转换,文档路径为:阿里云 -> 智能媒体管理 -> API 手册 -> Office 文档格式转换 -> CreateOfficeConversionTask

四、使用场景介绍

4.1 文件预览

基于文档格式转换,可以有4种不同模式的输出格式,它们都可以提供给浏览器实现文档预览。
其中向量模式,通过阿里云智能媒体管理产品提供的 JavaScript 渲染,可以让您选择文档里面的文字。
如何使用前端进行渲染,请参考 智能媒体管理产品文档转换/预览功能介绍(3)---预览原理

4.3 多屏共享

当前视频会议共享文档时,大都采用推送视频流的方式,会带来较大的流量压力,特别是随着加入视频会议的端增多的场景。
而将文档转换为 JPG 格式,并保存在 OSS 上,然后在视频会议多屏共享时,只需要同步翻页的控制信息,便可以实现。
这种方案,用更少的流量就可以完成视频会议的多屏共享。

4.3 云打印

如果您希望提供文档的云打印,可以直接调用 智能媒体管理产品 的文档转换 API,并转换为 pdf 格式,通过该格式可以很方便的进行打印。

4.4 文档首页LOGO

在 Mac 或者 Windwos 机器上,您都体验过文档按照首页进行展示的功能。
通过调用 智能媒体管理产品 的文档转换 API,并转换为 jpg 格式,然后把首页作为 Logo,可以很方便的在您的应用(例如网盘、内容管理平台、文档管理平台)上实现文档首页 Logo 显示。

五、参考文档

  1. 智能媒体管理产品文档转换/预览功能介绍(1)---Cloud Native架构
  2. 智能媒体管理产品文档转换/预览功能介绍(3)---预览原理
  3. 智能媒体管理产品文档转换/预览功能介绍(4)--快速搭建
目录
相关文章
|
Web App开发 API
智能媒体管理(IMM)文档转换/预览提供 API 按量计费模式
智能媒体管理 (Intelligent Media Management, IMM) 是阿里云的云服务,它通过 文档标准型 实例提供了 Cloud Native 架构的文档转换/预览功能 ,本文介绍 API 按量计费模式的配置。
3097 0
|
Web App开发 JavaScript
【转载文章】智能媒体管理文档预览快速搭建 NodeJS 教程
针对智能媒体管理产品文档预览功能,提供 NodeJS 的端到端快速搭建教程,同时官网提供了视频。
1044 0
|
Serverless
[ 转载文章 ]函数计算 (FC) 和智能媒体管理 (IMM) 结合构建 serverless 文档转换/预览服务
阿里云函数计算和智能媒体管理相结合,快速实现一个弹性高可用的文档转换/预览服务。
1189 0
|
Serverless PHP 对象存储
十分钟上线-FC&IMM构建serverless文档转换/预览服务
自从人类进入信息时代以来,办公文档是每个人日常频繁使用的工具,ppt、word、xls、wps、pdf 等为我们工作和生活带来了很多的便利,尤其进入云计算和移动互联网时代,人们可以利用各种终端来预览 ppt、word、pdf 等相关文档进行工作和学习,这种情况下,文档之间的格式转换,各种终端的适配预览显得尤为重要,在本文中,我们来看看阿里云函数计算和智能媒体管理相结合,快速实现一个弹性高可用的文档转换/预览服务。
3739 0
智能媒体管理服务控制台功能体验
智能媒体管理服务控制台功能体验
1733 0
bky
|
JavaScript 前端开发 对象存储
使用nodeJs快速搭建IMM文档预览服务
使用nodeJs搭建IMM文档预览服务
bky
3425 0
|
Web App开发 前端开发 安全
智能媒体管理产品文档转换/预览功能介绍(4)--快速搭建
智能媒体管理提供了 Cloud Native 架构的文档转换/预览服务,本文介绍快速搭建的示例,让您用 DIY 的体验方式实现文档预览功能。
5997 0
|
存储 JSON 数据挖掘
利用智能媒体管理(IMM) 搭建云相册指南
- 为用户创建智能云相册 - 支持人脸检测,获取包括人脸位置、表情、年龄等信息 - 支持人脸分组,可以根据人物搜索、展示照片 - 支持照片标签检测,可以根据标签对照片进行分类 - 支持地理位置检测,获取照片拍摄的具体位置、时间,并且可以进行搜索
976 0
|
存储 对象存储 计算机视觉
智能媒体管理(IMM)视频分析中明星识别介绍
智能媒体管理已经支持了视频分析功能,用户可以方便的使用该功能对存储在oss上的视频进行全面的分析。本文主要介绍利用智能媒体管理的视频分析功能来提取视频中的明星信息。 智能媒体管理的视频分析包含了明星识别功能,可以帮助用户抽取出视频中出现的明星信息。
2927 0
|
存储 计算机视觉 对象存储
智能媒体管理(IMM)视频分析在在线教育行业中的应用
智能媒体管理已经支持了视频分析功能,用户可以方便的使用该功能对存储在oss上的视频进行全面的分析。本文主要介绍利用智能媒体管理的视频分析功能来评估在线教育视频的质量。 智能媒体管理的视频分析包含了多种分析功能,针对在线教育行业,主要利用了人脸、内容理解以及语音转文字的功能。
1802 0

相关产品

  • 智能媒体管理