一分钟了解阿里云产品:表格存储

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

一、             概述

 

阿里云产品种类繁多,今天让我们一起来瞧瞧表格存储(Table Store)吧。

 

什么是表格存储呢?

 

简单来说,表格存储是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提供海量结构化数据的存储和实时访问。表格存储以实例和表的形式组织数据,通过数据分片和负载均衡技术,实现规模上的无缝扩展。应用通过调用表格存储 API / SDK 或者操作管理控制台来使用表格存储服务。

 

 

那么,表格存储有什么优势呢?

 

  • 表格存储具有很好的扩展性。应用在创建表的时候,需要根据业务访问的情况来配置预留读/写吞吐量。Table Store根据表的预留读/写吞吐量进行资源的调度和预留,从而保证应用获得可预期的性能。在使用过程中,应用还可以根据应用的情况动态修改预留读/写吞吐量。Table Store表的数据量没有上限,随着表数据量的不断增大,Table Store会进行数据分区的调整从而为该表配置更多的存储。
  •  表格存储在数据可靠性上也是值得信赖的。Table Store通过存储多个数据备份及备份失效时的快速恢复,提供极高的数据可靠性。
  • 表格存储具备高可用性。通过自动的故障检测和数据迁移,Table Store对应用屏蔽了机器和网络的硬件故障,提供高可用性。
  •  表格存储管理便捷,对应用的每一次请求都进行身份认证和鉴权,以防止未授权的数据访问,确保数据访问的安全性。
  •  表格存储保证数据写入强一致,写操作一旦返回成功,应用就能立即读到最新的数据。
  • Table Store的表无固定格式要求,每行的列数可以不相同,支持多种数据类型(Integer、Boolean、Double、String、Binary)。

 

此外,表格存储根据用户预留和实际使用的资源进行收费,起步门槛低。用户可以从Table Store控制台实时获取每秒请求数、平均响应延时等监控信息。

 

 

目前,施耐德、够快等都在使用表格存储。

 

 

表格存储典型特性介绍:

https://www.aliyun.com/product/ots/?spm=5176.383518.3.17.35dh1C

 

 

 

二、             技术点(表格存储五大热点技术问题分析)

 

在上一篇文章中,我们为大家介绍表格存储的概况,表格存储(Table Store)是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提供海量结构化数据的存储和实时访问。那在使用过程中,经常遇到的热门技术问题有哪些呢?

 

控制台使用:

https://help.aliyun.com/document_detail/ots/Getting-Started/instance_management.html?spm=5176.docots/Getting-Started/ots_console.6.88.oeD7cV

 

数据表管理:

https://help.aliyun.com/document_detail/ots/Getting-Started/table_management.html?spm=5176.docots/Getting-Started/instance_management.6.89.g7Civ4

 

表格存储TableStore支持的操作:

https://help.aliyun.com/knowledge_detail/5974469.html?spm=5176.788315012.2.4.QxIe8D

 

表格存储Table Store-建表时的注意事项:

https://help.aliyun.com/knowledge_detail/5974484.html?spm=5176.788315012.2.5.QxIe8D

 

Table Store 表的最佳实践:

https://help.aliyun.com/document_detail/ots/BestPractice/table.html?spm=5176.docots/BestPractice/Tools.6.155.hgnvaw

 

 

希望上面的内容,能够对大家有所帮助。

 

 

 

三、             体验(表格存储结合Elasticsearch构建爬虫搜索引擎)

 

今天给大家带来一篇技术文章,结合表格存储和Elasticsearch构建一个爬虫搜索引擎,非常有意思。只需要简单的几个命令即可构建一个Demo,欢迎感兴趣的人尝试。

 

Elasticsearch是一个实时分布式搜索和分析引擎,它的索引和搜索功能非常强大,所以使用场景很丰富。Elasticsearch基于Lucene,Lucene是一个非常复杂的搜索引擎库,而Elasticsearch提供的是更易用的一体化的分布式实时搜索应用。

 

下面就来一起看一下吧。

 

目标:爬取特定网站的页面,将页面内容保存在TableStore中,在Elasticsearch中建立网站的索引,通过web页面搜索框的形式,对爬取的页面进行搜索。

 

以天涯论坛为例,一套简单的方案:

 

爬取天涯论坛的帖子页面,提取的信息包括Url,标题,帖子内容。数据首先存入TableStore中,主键为随机的一个UUID,同时将Url、标题、帖子内容、UUID导入Elasticsearch中建立索引,Elasticsearch只保存Url、标题和UUID,不保存帖子内容。同时构建一个网页,通过搜索框输入关键词,在Elasticsearch中搜索获取结果。

 

1. 整个方案涉及四个模块:TableStore、Elasticsearch、Spider、Web。

 

2. TableStore不需要搭建,只需要开通服务、建表即可。我们使用TableStore来存取页面数据,每个页面的数据保存为TableStore的一行,使用UpdateRow写入,使用GetRow读出。

 

3. Elasticsearch需要在ECS中搭建起来,搭建Elasticsearch非常简单,只需要下载下来运行启动脚本即可。与TableStore建表类似,在搭建完成Elasticsearch之后,需要在Elasticsearch中建立索引(Index),并需要在索引上建立映射(Mapping)。

 

4. Spider具体爬取页面,我们选取了一个简单易用的开源爬虫软件,WebMagic。使用WebMagic的接口,我们可以方便的把爬取的页面数据存入TableStore和Elasticsearch。

 

5. Web指网页搜索的前后端。出于开发效率的考虑,我们选择一些接口简单易用的工具进行开发,后端使用一个Python的web框架flask,前端使用vue.js。

 

 

快速部署与体验

 

1.       项目代码解压后结构如下所示, 请先阅读README.md文件:

ca928914876ffed133d9c1d0e391cdc447b3c894

 

2.执行以下命令生成配置文件:

cp config.ini.template config.ini

3.修改配置文件,填入endpoint, accessid, accesskey, instancename等信息,需要在阿里云官网开通表格存储服务,然后创建实例。

4. 安装相关软件。

5. 初始化:

启动Elasticsearch。

初始化TableStore表和Elasticsearch索引。

6. 运行爬虫。

7. 运行搜索Web界面。

8. 访问:

446cba1410d3f315f758cb23ed564088fee05187

 

以上就是我使用表格存储的部分经验,希望大家有所收获。

 

如果您想详细了解表格存储,请访问:

https://bbs.aliyun.com/read/267146.html?spm=5176.bbsl226.0.0.p5BHrb

 

 

深入浅出OTS

https://bbs.aliyun.com/read/261983.html?spm=5176.bbsl226.0.0.q8iF7R

 

OTS Java SDK优化实践:

https://bbs.aliyun.com/read/262760.html?spm=5176.bbsl226.0.0.aFLZz9

 

相关实践学习
阿里云表格存储使用教程
表格存储(Table Store)是构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服务,根据99.99%的高可用以及11个9的数据可靠性的标准设计。表格存储通过数据分片和负载均衡技术,实现数据规模与访问并发上的无缝扩展,提供海量结构化数据的存储和实时访问。 产品详情:https://www.aliyun.com/product/ots
目录
相关文章
|
1天前
|
存储 弹性计算 Cloud Native
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
|
5天前
|
文字识别 JavaScript Java
印刷文字识别产品使用合集之阿里云文字识别OCR demo主要有哪些
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
139 0
|
6天前
|
Cloud Native 数据库
阿里云产品四月刊来啦
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代,详情请点击阿里云产品四月刊
210 3
阿里云产品四月刊来啦
|
6天前
|
人工智能 API
阿里云微服务引擎及 API 网关 2024 年 4 月产品动态
阿里云微服务引擎及 API 网关 2024 年 4 月产品动态。
|
6天前
|
运维 Cloud Native 应用服务中间件
阿里云微服务引擎 MSE 及 API 网关 2024 年 04 月产品动态
阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要。
|
6天前
|
Cloud Native 关系型数据库 分布式数据库
数据库性能诊断工具DBdoctor通过阿里云PolarDB产品生态集成认证
DBdoctor(V3.1.0)成功通过阿里云PolarDB分布式版(V2.3)集成认证,展现优秀兼容性和稳定性。此工具是聚好看科技的内核级数据库性能诊断产品,运用eBPF技术诊断SQL执行,提供智能巡检、根因分析和优化建议。最新版V3.1.1增加了对PolarDB-X和OceanBase的支持,以及基于cost的索引诊断功能。PolarDB-X是阿里巴巴的高性能云原生分布式数据库,兼容MySQL生态。用户可通过提供的下载地址、在线试用链接和部署指南体验DBdoctor。
155 0
|
6天前
|
Prometheus 监控 数据可视化
阿里云可观测 2024 年 4 月产品动态
阿里云可观测 2024 年 4 月产品动态。
|
6天前
|
存储 Cloud Native 对象存储
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
AutoMQ[1] 是新一代基于共享存储架构实现的云原生 Kafka。得益于其存算分离的共享存储架构,通过和阿里云合作,深度使用阿里云可靠、先进的云服务如对象存储OSS、块存储 ESSD、弹性伸缩ESS以及抢占式实例实现了相比 Apache Kafka 10倍的成本优势并且提供了自动弹性的能力。
83459 5
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
|
6天前
|
消息中间件 人工智能 监控
|
6天前
|
数据库 云计算
电子好书发您分享《阿里云产品手册2024版》
**阿里云2024产品手册电子版分享:** 探索最新云计算解决方案,涵盖智能计算、视觉智能与云数据库ClickHouse。了解阿里云在新的一年中提供的核心产品与服务升级,包括适用于初学者的云服务器选项。查看完整手册:[阿里云产品手册2024版](https://developer.aliyun.com/ebook/8326/116556?spm=a2c6h.26392459.ebook-detail.4.50ae272a22gHxh)。
85 9

热门文章

最新文章