OSS Select-让提取数据价值更简单、更快速
对象存储OSS(Object Storage Service)具有海量、可靠、安全、高性能、低成本的特点。OSS提供标准、低频、归档类型,覆盖多种数据从热到冷的存储需求,单个文件的大小从1字节到48.8TB,可以存储的文件个数无限制。OSS已成为互联网、企业级数据应用的基础设施。
通常,获取对象存储数据的通方式为:获取整个对象,或按指定的字节范围来获取数据。OSS Select推出后,可以直接使用简单的SQL语句,从OSS的文件中选取所需要的内容。
本文将介绍如何在控制台轻松体验OSS Select的功能。
准备数据
控制台
登录控制台,并创建bucket
请创建华南1的测试bucket(您可以选择你自己想要创建的bucket名字)
下载模拟数据到本地(该数据本次实验的模拟数据)
http://testdatasample.oss-cn-hangzhou.aliyuncs.com/people/people.zip
将下载的数据解压,并放到刚才创建的bucket里
执行SQL,选取内容
点击刚上传Object最右边的更多按钮,然后再点击选取内容按钮,打开选取内容对话框
点击显示文件预览按钮,我们可以预览这个文件
我们可以看到这个文件有3列,分别是姓名、公司和年龄。
然后点击下一步按钮,我们可以输入SQL来执行, 比如我们想查找年龄大于50岁,并且名字以Lora开头的人(其中_1, _2, _3是列索引,代表第一列、第二列、第三列以此类推)
select * from ossobject where _1 like 'Lora*' and _3 > 50
得到如下结果:
比如我们想统计这个文件有多少行,最大年龄与最小年龄是多少,我们可以执行如下SQL
select count(*), max(cast(_3 as int)), min(cast(_3 as int)) from ossobject
得到如下结果:
其他
OSS Select更高级的用法,请参考OSS相关的SDK(Java/Python,其他语言的OSS Select支持在开发中)
参考文章
https://yq.aliyun.com/articles/593910?spm=5176.10695662.1996646101.searchclickresult.41a75825WS8Atv