数据的力量:构筑现代大型网站之数据库基础与应用

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: 数据的力量:构筑现代大型网站之数据库基础与应用



数据库基础知识--前言

大型网站架构特点

和传统企业应用系统相比,大型网站系统具备如下特点:

  • 高并发,大流量:需要扛得住高并发,大流量的用户访问。Google日均PV数35亿,日均IP访问数3亿;腾讯QQ同时在线用户数过亿;淘宝双11当天活动交易额过百亿,活动开始的第一分钟独立访问用户数达千万。
  • 高可用:网站系统需要7*24小时不间断提供服务,大型网站的宕机事件通常都会成为新闻焦点,例如百度域名曾被黑客劫持无法访问。
  • 海量数据,高可用数据库:需要存储,管理海量数据,使用大量的服务器。
  • 世界各地用户分布广泛,网络环境复杂:大型网站都是为全球用户提供服务,全球各地网络环境千差万别,即使国内也有多个运营商网络互通难的问题,面对海外用户还得假设海外数据中心。
  • 服务器安全问题:互联网的开放性,很容易受到黑客攻击,需要保护服务器安全,保证数据安全。
  • 需求快速变更,发布频繁:和传统应用比较不同,互联网产品为了快速满足市场需求,产品发布率很高,一天内网站发布几十次已是正常。
  • 渐进式发展:即使是世界级大型网站,也都是由小型架构慢慢演变而来,如阿里巴巴本是在马云家中客厅诞生。

总的来说,大型网站的架构特点要求数据库必须具备高性能、高可用性、可扩展性和安全性。这些要求直接影响了数据库的选择、设计和优化策略。

DBA数据库管理员

数据库管理员(Database Administrator,简称DBA),是从事管理和维护数据库管理系统(DBMS)的相关工作人员的统称,属于运维工程师的一个分支,主要负责业务数据库从设计、测试到部署交付的全生命周期管理。

DBA的核心目标是保证数据库管理系统的稳定性、安全性、完整性和高性能。

在国外,也有公司把DBA称作数据库工程师(Database Engineer),两者的工作内容基本相同,都是保证数据库服务7*24小时的稳定高效运转,但是需要区分一下DBA和数据库开发工程师(Database Developer):

  1. 数据库开发工程师的主要职责是设计和开发数据库管理系统和数据库应用软件系统,侧重于软件研发;
  2. DBA的主要职责是运维和管理数据库管理系统,侧重于运维管理。

毋庸置疑,所有互联网网站最头的瓶颈就是企业的后端数据库,而MSQL更是重中之重,谁掌握了数据库技术,谁就能轻松拿到高薪,并且数据库管理岗位比其他岗位更受企业重视,因为数据安全是企业最重要的生命线,没有之一。

并且数据库又分为很多种,包括关系型数据库,缓存数据库,我们重点学习的是企业里最常用的

  • mysql,mariadb
  • redis

什么是数据?

数据就是数值,也就是我们通过观察、实验或计算得出的结果。

数据有很多种,最简单的就是数字

数据也可以是文字、图像、声音等

我们打游戏最怕什么?最怕被盗号,怕自己的账号,密码丢失。

打游戏时候,腾讯为了保护大家的账号安全,提供了密保卡,进行坐标验证登录。

数据存储

很早很早以前,古人是这么存数据的

结绳、契刻、结珠、石头替代法等等,如今纸张是人们广泛使用的信息载体。但是书籍不便于查询、共享、储藏等缺点。

随着计算机的发展,人们将信息转化为二进制数字,存储在磁性存储介质中,也就是磁盘进行数据记录。数据通过文件系统管理,以文件形式显示出来。

但是大量的文件数据,查询内容,还是很不方便。

在这个背景下,一个专门用于数据管理的工具诞生了,它能让我们更简单的管理数据。

什么是数据库

顾名思义,数据库(DB,database)按照数据结构来组织、存储和管理数据的“仓库”,是一个文件或者一组文件。

是数据库中存储数据的基本单位,数据按照分类存储在不同的 表 中,便于查询。

数据库可以通过统一的一些指令对数据进行增、删、改、查(Create,Retrive,Updata,Delete)等操作例

如财务人员使用Excel统计公司资产信息,进行管理,计算账户,Excel是微软推出的一款电子表格软件,提供计算和图标展示。

数据表的概念

数据表可以有很多,存储不同的信息 也就是不同的数据,分别写在不同的数据表中,也就是table的概念,可以理解为excel的表格。

如图:

Excel很强大,但是对于企业来说,业务需求庞大,用Excel可能会有成千上万张,并且存储管理很麻烦,员工和客户想要实时知道企业数据,不可能把一个巨大无比的Excel发送给用户。

因此数据库软件应运而生,

为什么需要mysql这样的数据库管理工具?

因为

  • excel表格难以保存,容易丢失,损坏等等
  • 难以进行复杂的查询,比如多张表的连接查询

DBMS

数据库管理系统Database Management System,数据库管理系统

这一软件用于创建和操作数据库。

主流数据库软件,如Mysal(免费),Oracle(收费,甲骨文公司),Microsoft SQL Server、SQLite (轻型)等。

mysql主要用于大型门户,例如搜狗、新浪等,它主要的优势就是开放源代码,因为开放源代码这个数据库是免费的,他现在是甲骨文公司的产品。

oracle主要用于银行、铁路、飞机场等。该数据库功能强大,软件费用高。也是甲骨文公司的产品。

sql server是微软公司的产品,主要应用于大中型企业,如联想、方正等。

收费数据库与免费数据库

收费数据库与免费数据库在多个方面存在差异,以下是一些主要区别:

1.成本

  • 免费数据库通常是开源的,用户可以免费下载和使用,不需要支付授权费用。例如,MySQL和PostgreSQL都是广泛使用的免费数据库。
  • 收费数据库则需要用户购买使用授权,通常会根据服务器数量、处理器数量或使用的用户数量等来计算费用。

2.支持和维护

  • 免费数据库虽然可以免费使用,但用户需要自行负责数据库的维护和支持。虽然通常有社区支持和文档资源,但可能没有及时的技术支持服务。
  • 收费数据库一般会提供专业的技术支持和维护服务,这对于商业环境中对稳定性和安全性要求较高的应用场景来说非常重要。

3.功能和性能

  • 免费数据库通常具备基本的功能和性能,适合个人学习、开发测试或小型项目使用。
  • 收费数据库可能提供更多高级功能,如数据仓库、高可用性、灾难恢复等,并且可能提供更好的性能优化和扩展能力。

4.定制和灵活性

  • 免费数据库由于是开源的,用户可以根据自己的需求进行定制开发。
  • 收费数据库可能提供更灵活的定制选项,以满足特定的业务需求。

5.社区和生态系统

  • 免费数据库通常拥有活跃的社区,用户可以从社区中获得帮助和资源。
  • 收费数据库可能有更专业的用户群体和合作伙伴网络。

6.风险和责任

  • 使用免费数据库时,所有的维护和问题解决责任都在用户自己,而收费数据库通常由供应商提供保障和服务。

总的来说,免费数据库对于成本敏感和非关键应用是一个不错的选择,而收费数据库则更适合那些需要专业支持、高级功能和高度可靠性的商业环境。在选择数据库时,应根据项目的具体需求、预算和技术能力来决定使用哪种类型的数据库。

数据库,简而言之就是有组织的存储数据的一个仓库(本质就是文件信息管理)。

如同冰箱存储食物,衣柜存放衣物。我们每天登陆QQ,微信,查询支付宝余额,银行卡余额,都是软件去读取查找数据库记录。

日常生活,我们一直一直在使用数据库管理软件,譬如电话簿里找名字,百度搜索"如何变有钱"也是在用数据库。

运维和数据库

说白了,数据库就是存数据的,是一款软件,用专门的数据库语言,增删改查数据。

这就好比我们平时对电脑里的数据管理

  • 多个文件夹,分类管理。
  • 文件夹里的文件,数据,照片,视频,游戏

我们在公司里,和开发对接,对数据进行管理 数据库的形式 自己在linux上,直接安装,例如下图,数据都在linux机器磁盘上,运维自己管理

云服务器RDS产品(数据库安装在阿里巴巴的服务器上,我们通过账号密码,远程使用)

开发与运维的不同阶段

数据库类别

目前主流数据库软件,分为两种

  • 关系型数据库
  • 非关系型数据库

为何出现这2种类型数据库

  • web1.0时代,互联网发展慢,基本只是企业提供网站,用户浏览资料,上网的人还少,互联网还没那么多复杂的功能,网站压力很轻,因此mysql轻松干活
  • 随着互联网Web2.0、Web3.0网站的兴起,传统的关系型数据库在应付这些网站,特别是对于规模日益扩大的海量数据,超大规模和高并发的微博、微信等类型的动态网站时已经显得力不从心,暴露了很多难以克服的问题,例如,传统关系型数据库的I/0瓶颈、性能瓶颈等都难以有效突破。于是出现了大批针对特定场景,以高性能、高并发以及使用便利为目的的功能特异化的数据库产品
  • NoSQL出现,专注于解决高并发场景,大流量的场景,解决部分数据存读写的性能问题
  • 非关系型数据库就是在这样的情景中诞生并得到非常迅速发展的。在这些特定的场景下,NOSQL数据库可以发挥出难以想象的高效率和高性能。近年来,NOSQL这个术语得到了广泛认同。

数据库具体应用场景

相亲网

譬如网站的注册登录功能,正确流程是,注册成功->可以登录。

工程师就要检测在注册成功后,检查数据库是否正确保留了信息。

如百合网的登录页面:

比如我想找个女朋友,果断去注册一个账号。。

以上数据,如果用Excel管理,存储每一条记录如下

如用数据库管理软件(mysql),如下

友情提醒

数据库方面知识,主要以运维、开发分为两个方向,不同的方向所重点学习的内容不一样

  • 运维人员,主要是对数据库架构、设计、维护
  • 单实例、多实例
  • SQL语句基础CURD学习、权限管理
  • 字符集、数据库引擎
  • 备份方案
  • 复制方案
  • 高可用方案
  • 开发人员,主要是对数据进行设计、开发
  • 针对业务进行数据库设计、表结构设计
  • 高性能索引
  • 视图
  • 存储过程
  • 函数

希望对你有帮助!加油!

若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
15天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
17天前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
56 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
9天前
|
缓存 NoSQL 数据库
运用云数据库 Tair 构建缓存为应用提速,完成任务得苹果音响、充电套装等好礼!
本活动将带大家了解云数据库 Tair(兼容 Redis),通过体验构建缓存以提速应用,完成任务,即可领取罗马仕安卓充电套装,限量1000个,先到先得。邀请好友共同参与活动,还可赢取苹果 HomePod mini、小米蓝牙耳机等精美好礼!
|
14天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
16天前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
30 3
|
16天前
|
存储 Java 关系型数据库
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接创建、分配、复用和释放等操作,并通过电商应用实例展示了如何选择合适的连接池库(如HikariCP)和配置参数,实现高效、稳定的数据库连接管理。
33 2
|
22天前
|
人工智能 Cloud Native 容灾
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
|
8天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
23 4
|
6天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
20 1
|
15天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
81 1