开发者社区> terry.zhouh> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

OSS数据处理最佳实践--文档预览

简介: 阿里云存储开放的数据湖体系引入众多计算引擎。通过阿里云智能媒体管理产品,对象存储OSS面向视频处理应用,图像处理应用,文档处理应用开放了接入能力。这里帮助大家快速讲解如果实现OSS上offcie文档预览。
+关注继续查看

前言

当前整个企业级数据管理市场面临着数字化转型,如何更好的管理数据、挖掘非结构化数据(专业文档、视频、图像等)的价值是当前企业需要解决的问题。

阿里云存储开放的数据湖体系引入众多计算引擎。通过阿里云智能媒体管理产品,对象存储OSS面向视频处理应用,图像处理应用,文档处理应用开放了接入能力。目前通过智能媒体管理支持图像识别、人脸检测、视频截帧、图片处理、文档预览、文本检索等多项数据处理能力,为上层应用提供强有力的支持。

框架介绍

menu_saveimg_savepath20190212105023

阿里云OSS为在云上的数据打通了一个处理与使用的快速通道。通过简单的 RESTful 接口,可以在任何时间、任何地点、任何互联网设备上对存储在OSS中的数据进行分析处理。

数据处理包含以下两种:

  • 阿里云OSS原生处理服务
    阿里云OSS原生处理服务包括图片处理和视频截帧,其中图片处理包括图片的缩略、剪裁、参数调节等, OSS原生处理服务无需开通,默认集成在OSS中,创建完Bucket后即可使用。产生的数据处理费用直接在OSS上结算。
  • 智能媒体管理服务
    阿里云OSS与智能媒体管理(IMM)深度结合,支持文档预览、文档格式转换、人脸识别、图片分析、二维码识别等丰富的数据分析处理操作。

操作示例:当操作用于即时处理返回结果时,可以采用GET方式触发。参数在QueryString中传递。如:http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/circle,r_100 (该请求是Public请求,无需签名。部分操作必须通过进行签名后才能进行操作。)

文档预览实践

这里实现OSS上面的文档预览来快速帮助大家体验整个流程。当前的文档预览支持主要的office系列格式。

步骤1:开通相关产品

实现文档预览主要依赖于外部的智能媒体管理,将其作为插件接入到OSS进行使用。

  • 开通对象存储OSS:点击这里
  • 开通智能媒体管理:点击这里
  • 开通智能媒体管理后,进入管理控制台,会弹窗提示授权 IMM 访问 OSS 的相关权限。这里点击同意;
    154762710433934_zh_CN_source

步骤2:创建 或进入OSS Bucket

在北京、杭州、上海、深圳区域选择已有Bucket(智能媒体管理处理插件功能仅上述区域支持)。
如果还没有Bucket,创建标准存储类型即可:

menu_saveimg_savepath20190212112210

步骤3:绑定智能媒体管理

menu_saveimg_savepath20190212112457

进入 智能媒体 管理栏,如果是初次使用,可以点击 批量创建 按钮,勾选 文档预览 选择框。即绑定完成。
通过 批量创建 会帮助默认创建一个智能媒体管理项目,然后与该Bucket绑定。如果需要绑定现有的项目,或者解绑,可以点击绑定后的 设置 进行选择调整。

步骤4:实践使用

方式一:控制台直接查看

menu_saveimg_savepath20190212114344

进入控制台 文件管理 栏,点击任何office系列文档即能立即在线预览。

方式二:SDK方式调用

154754499133931_zh_CN

  1. 客户端向服务端发起预览请求,并提供要预览的文件。
  2. 服务端根据请求文件进行 URL 签名,将签名完成的 URL 提供给客户端。
  3. 客户端拿到签名后直接访问 OSS 查看文件。

服务端签名生成预览URL的代码如下:

# 创建存储空间实例,所有文件相关的方法都需要通过存储空间实例来调用。
bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)
# 文档预览,获取signURL。
process = 'imm/previewdoc,copy_1'
params = {}
params.update({bucket.PROCESS: process})
url = bucket.sign_url("GET", objectKey, 3600, params=params)
#打印结果
print url

更多数据处理能力

更多数据处理,点击查看

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
将OSS数据导入日志服务操作实践
OSS与日志服务相比,OSS存储的成本更低,不过日志服务中查询、结果展示、实时监控、数据加工等功能是OSS所不具备的。所以,可以将历史数据投递到OSS进行长期保存,SLS存储近期有查询分析需要的数据。<br />当历史数据有查询、分析需求时可以将OSS中的数据重新导入到SLS。
1114 0
新功能:OSS访问日志实时分析
新功能发布:OSS访问日志实时分析,秒级延迟,支持4大场景,欢迎使用!
4044 0
使用Cloudberry Explorer管理和访问阿里云OSS
对于从Amazon S3迁移到OSS用户,往往希望最小化客户端应用和工具改动,以达到尽可能平滑的迁移,减少迁移成本。本文以S3常用客户端工具Cloudberry Explorer for Amazon S3为例,介绍如何配置使用S3客户端工具管理和访问阿里云OSS上的资源。
4392 0
阿里云对象存储 OSS,不使用主账号,使用子账号来访问存储内容
https://help.aliyun.com/document_detail/31932.html?spm=5176.doc31929.2.5.R7sEzr   这个示例从一个没有任何Bucket的阿里云用户开始,以下内容中出现的AccessKey请替换成用户自己对应的AccessKey。
1321 0
OSS访问域名使用规则
OSS域名构成规则 针对OSS的网络请求,除了GetService这个API以外,其他所有请求的域名都是带有指定Bucket信息的三级域名组成的。 访问域名规则:BucketName.Endpoint。
8742 0
E-MapReduce的Presto组件默认支持访问oss数据
阿里云E-MapReduce从EMR-2.1.0版本镜像开始,Presto组件默认就支持访问oss数据了,不再需要引导操作额外支持。
2440 0
用引导操作打通presto访问oss数据
目前EMR Presto 已经完全支持 OSS 访问,如有其他 Presto 集群访问 OSS 需求,请安装 JindoFS SDK,可以直接访问 oss https://developer.aliyun.com/article/767222
5173 0
阿里云设置CDN加速访问OSS文件
快速配置OSS:https://help.aliyun.com/document_detail/31885.html?spm=5176.doc31886.6.97.8iuJo5 快速配置CDN:https://help.
1286 0
+关注
文章
问答
来源圈子
更多
阿里云存储基于飞天盘古2.0分布式存储系统,产品包括对象存储OSS、块存储Block Storage、共享文件存储NAS、表格存储、日志存储与分析、归档存储及混合云存储等,充分满足用户数据存储和迁移上云需求,连续三年跻身全球云存储魔力象限四强。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
阿里云 JindoFS+OSS 数据上云实战
立即下载
云存储之OSS实战进阶分享
立即下载
OSS运维进阶实战手册
立即下载