云栖社区老同学,软件工程学生党。研究兴趣:软件工程、软件架构设计、软件过程、DevOps以及微服务等。
布隆过滤器(Bloom Filter)是由Burton Bloom 在1970年提出的,其后在P2P上得到了广泛的应用。一个空的布隆过滤器是一个m位的位数组,所有位的值都为0。定义了k个不同的符合均匀随机分布的哈希函数,每个函数把集合元素映射到位数组的m位中的某一位。Bloom filter算法可用来查询某一数据是否在某一数据集合中。其优点是查询效率高、可节省空间。但其缺点是会存在一定的错误。因此Bloom filter 算法仅仅能应用于那些同意有一定错误的场合。可使用Bloom filter 算法的场合包含字典软件、分布式缓存、P2P网络和资源路由等等。
外部数据包装器FDW(Foreign Data Wrappers)是 SQL 标准 SQL/MED(SQL Management of External Data)开发的 Postgres 实现。FDW 提供了一系列统一的公共接口,使得扩展程序可以轻松地在优化、执行、扫描、更新和统计等核心部分和 Postgres 深度集成,从而可以用 SQL 语句直接查询和操作外部数据源
锁是数据库中的一个非常重要的概念,当多个用户同时对数据库并发操作时,会带来数据不一致的问题,所以,锁主要用于多用户环境下保证数据库完整性和一致性。
LLVM命名最早源自于底层虚拟机(Low Level Virtual Machine)的缩写,由于命名带来的混乱,目前LLVM就是该项目的全称。LLVM 核心库提供了与编译器相关的支持,可以作为多种语言编译器的后台来使用。能够进行程序语言的编译器优化、链接优化、在线编译优化、代码生成。
在PostgreSQL等数据库中,JIT指的是即时编译(Just-in-time Compilation),即程序在运行过程中即时进行编译,其中可以把编译的中间代码缓存或者优化。相对于静态编译代码,即时编译的代码可以处理延迟绑定并增强安全性。
PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是从加州大学伯克利分校写的POSTGRES软件包发展而来的。经过二十多年的发展,PostgreSQL是世界上是最先进的开源数据库之一。始于大学研究,所以整个PostgreSQL具有高度的理论支撑,同时具有严谨的代码设计风格,工业级的代码设计。POSTGRES是由图灵奖的获得者Michael Ralph Stonebraker最初主持设计开发的,具有许多先进的数据库理念。其中许多概念在很久以后才出现在一些商业数据库系统中。
MySQL的EXPLAIN命令可以查看SELECT语句的执行的计划,是 MySQL 查询优化的必备工具。通过执行计划可以了解查询方式、索引使用情况、需要扫描的数据量以及是否需要临时表或排序操作等信息。我们需要分析执行计划对查询进行有的放矢的优化。
查询优化器是数据库中负责生成 SQL 语句的有效执行计划的数据库引擎组件,具体地说,查询优化器是针对用户的请求进行内部优化,生成(或重用)执行计划并传输给存储引擎来操作数据,最终返回结果给用户的组件。它是关系型数据库管理系统的核心之一,决定对特定的查询使用哪些索引、哪些关联算法、从而使其高效运行,它是优化器中最重要的组件之一。
数据库存储引擎是数据库底层软件组件,数据库管理系统使用数据引擎进行创建、查询、更新和删除数据操作。不同的存储引擎提供不同的存储机制、索引技巧、锁定水平等功能,使用不同的存储引擎还可以获得特定的功能。现在许多数据库管理系统都支持多种不同的存储引擎。MySQL的核心就是存储引擎。
MyISAM是MySQL 5.1版本之前的默认存储引擎。MyISAM基于更老的ISAM (Indexed Sequential Access Method)代码,但有很多有用的扩展。MyISAM不支持事务处理的,而且不支持外键,如果执行大量的Select,Insert操作,MyISAM比较适合。
RPM(全称为Red Hat Package Manager,亦称为The RPM Package Manager)是在Linux下广泛使用的软件包管理器。最早由Red Hat研制,现在也由开源社区开发。
Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。伴随着互联网的发展,Linux得到了来自全世界软件爱好者、组织、公司的支持。它除了在服务器操作系统方面保持着强劲的发展势头以外,在个人电脑、嵌入式系统上都有着长足的进步。使用者不仅可以直观地获取该操作系统的实现机制,而且可以根据自身的需要来修改完善这个操作系统,使其最大化地适应用户的需要。
索引是为了加速对表中数据行的检索而创建的一种分散的存储结构。索引是针对表而建立的,它是由数据页面以外的索引页面组成的,每个索引页面中的行都会含有逻辑指针,以便加速检索物理数据。
子查询(Sub Query)是嵌套在主查询中的SELECT查询语句,即当一个查询是另一个查询的条件时,称之为子查询。子查询嵌套在一个 SELECT、SELECT...INTO 语句、INSERT...INTO 语句、DELETE 语句、或 UPDATE 语句或嵌套在另一子查询中。
连接查询是关系数据库中最主要的查询,主要包括内连接、外连接和交叉连接。通过连接运算符可以实现多个表查询。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。 在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当检索数据时,通过连接操作查询出存放在多个表中的不同实体的信息。连接操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的表,然后通过连接进行查询。
关系模型(Relational Model) 是以集合论中的关系概念为基础发展起来的。关系模型中无论是实体还是实体间的联系均由单一的结构类型——关系来表示。在实际的关系数据库中的关系也称表。一个关系数据库就是由若干个表组成。关系模型是指用二维表的形式表示实体和实体间联系的数据模型。
对象模型(Object Model)是一种新兴的数据模型,它采用面向对象的方法来设计数据库。面向对象的数据库存储对象是以对象为单位,每个对象包含对象的属性和方法,具有类和继承等特点。
概念模型(Conceptual Model)也称为信息模型,是一种或多或少的形式化描述,描述的内容包括建立软件组件时,所用到的算法、架构、假设与底层约束。这通常是对实际的简化描述,包括一定程度的抽象,显式或隐式地按照头脑中的确切使用方式进行构建。
在数据库中,我们通常希望在每次插入新记录时,自动地创建主键字段的值。此时,我们可以在表中创建一个AUTO INCREMENT字段。注意设置自增字段时,字段类型必须为Int型,一般都用来作为主键。
DEFAULT 约束用来指定某列的默认值。如果没有规定其他的值,那么会将默认值添加到所有的新记录。
CHECK 约束用于限制列中的值的范围,限制范围取决于<Sql表达式>。如果对单个列定义 CHECK 约束,那么该列只允许特定的值。如果对一个表定义 CHECK 约束,那么此约束会基于行中其他列的值在特定的列中对值进行限制。
外键是一个表的字段,不是本表的主键,但对应另一个表的主键。外键主要用来在两个表的数据之间建立连接,可以是一列或者多列。一个表可以有一个或者多个外键。
PRIMARY KEY 约束唯一标识数据库表中的每条记录。主键必须包含唯一的值,且主键列不能包含 NULL 值。每个表都应该有一个主键,并且每个表只能有一个主键。
UNIQUE 约束唯一标识数据库表中的每条记录。UNIQUE 和 PRIMARY KEY 约束均为列或列集合提供了唯一性的保证。PRIMARY KEY 约束拥有自动定义的 UNIQUE 约束。
NOT NULL 约束强制列不接受 NULL 值。NOT NULL 约束强制字段始终包含值。这意味着,如果不向字段添加值,就无法插入新记录或者更新记录。
SQL 约束用于规定表中的数据规则。如果存在违反约束的数据行为,行为会被约束终止。约束可以在创建表时规定(通过 CREATE TABLE 语句),或者在表创建之后规定(通过 ALTER TABLE 语句)。
GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。这一版的GBK规范为1.0版。
聚合函数(Aggregate Function)是SQL基本函数。聚合函数对一组值执行计算,并返回单个值,也被称为组函数。除COUNT以外,聚合函数忽略空值,如果COUNT函数的应用对象是一个确定列名,并且该列存在空值,此时COUNT仍会忽略空值。
视图是从一个或几个基本表(或视图)中导出的虚拟的表。在系统的数据字典中仅存放了视图的定义,不存放视图对应的数据。视图与表(有时为与视图区别,也称表为基本表——Base Table)不同,视图所对应的数据不进行实际存储,数据库中只存储视图的定义,在对视图的数据进行操作时,系统根据视图的定义去操作与视图相关联的基本表。在 SQL 中,视图是基于 SQL 语句的结果集的可视化的表。
在关系型数据库表中,数据类型较为常见的包括整形(int),单精度(folat),双精度(double),可变长度字符(varchar),固定长度字符(char),长型(long),日期(date)等。对于不同的关系型数据库管理系统而言,往往具有不同的数据类型,这里以MySQL数据库为例,介绍SQL中的数据类型。
SQL方言(或者数据库方言)指的是用于访问数据库的结构化查询语言的变体,根据具体的数据库系统不同,也可能会支持不同的方言。
SQL标准是由国际标准化组织(ISO)、美国国家标准委员会ANSI等制定的,对数据库管理系统的统一操作方式。
指针控制语言(Cursor Control Language, CCL)规定了 SQL语句在宿主语言的程序中的使用的规则,是SQL语言的分类之一。CCL包含了DECLARE CURSOR(声明游标)、FETCH INTO(进入)和UPDATE WHERE CURRENT(更新当前位置)等语句,主要用于用于对一个或多个表单独行的操作。
事务控制语言(Transaction Control Language, TCL)是SQL语言四大主要分类之一,是SQL语言的子集,用于控制数据库中的事务处理。事务是包含一个或多个SQL语句的逻辑工作单元,通常是一组数据操作语言(DML)语句。TCL的语句能确保被DML语句影响的表的所有行及时得以更新。
数据定义语言(Data Definition Language, DDL)是SQL语言四大主要分类之一,是SQL语言集中负责数据结构定义与数据库对象定义的语言,最早是由 Codasyl(Conference on Data Systems Languages) 数据模型开始,现在被纳入 SQL 指令中作为其中一个子集。
数据控制语言(Data Control Language, DCL)是SQL语言四大主要分类之一,是用来设置或者更改数据库用户或角色权限的语句,通过GRANT或REVOKE实现权限控制,确定单个用户和用户组对数据库对象的访问。某些RDBMS可用GRANT或REVOKE控制对表单个列的访问。在默认状态下,只有sysadmin、dbcreator、db_owner或db_securityadmin等角色的成员才有权利执行数据控制语言。
数据操纵语言(Data Manipulation Language, DML)是SQL语言的四大主要分类之一,用户通过它可以实现对数据库数据的基本操作。这种操作包括将数据插入数据库表、检索现有数据、从现有表中删除数据和更新现有数据。
数据查询语言(Data Query Language, DQL),也称为数据检索语句,即数据库管理系统用来查询数据的语言,其用于从数据表里获得数据,确定数据怎样在应用程序给出。
结构化查询语言(Structured Query Language, SQL),是一种用于特定领域的语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
Root是指一种存在于UNIX系统,AIX、BSD等和类UNIX系统,如Linux、Debian、Redhat、Ubuntu、archlinux等liunx发行版以及Android系统中的唯一的超级用户,其相当于Windows系统中的SYSTEM(XP及以下)/TrustedInstaller(Vista及以上)用户。
UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。
TCP/IP(Transmission Control Protocol/Internet Protocol,传输控制协议/网际协议)是指能够在多个不同网络间实现信息传输的协议簇。TCP/IP协议不仅仅指的是TCP 和IP两个协议,而是指一个由FTP、SMTP、TCP、UDP、IP等协议构成的协议簇,只是因为在TCP/IP协议中TCP协议和IP协议最具代表性,所以被称为TCP/IP协议。
对于关系型数据库的事务而言,具有四个强一致性(Strong Consistency)要求,也称为ACID.
数据库事务(Transaction)是访问并可能操作各种数据项的一个数据库操作序列,这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。
InnoDB是MySQL的数据库引擎之一,现为MySQL的默认存储引擎,为MySQL AB发布binary的标准之一。InnoDB由Innobase Oy公司所开发,2006年五月时由美国甲骨文(Oracle)公司并购。与传统的ISAM与MyISAM相比,InnoDB的最大特色就是支持了ACID兼容的事务(Transaction)功能,类似于PostgreSQL。
MySQL是一种开放源代码的关系型数据库管理系统,也是目前业界最为流行的关系型数据库管理系统之一。其可以使用最常用结构化查询语言进行数据库操作。其最初由瑞典MySQL AB公司开发,目前属于美国Oracle公司旗下产品。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。
Sybase是由美国Sybase公司(于2010年成为SAP的全资子公司)研制的一种关系型数据库管理系统,是一种典型的UNIX或Windows NT平台上客户机/服务器环境下的大型数据库系统。Sybase提供了一套应用程序编程接口和库,可以与非Sybase数据源及服务器集成,允许在多个数据库之间复制数据,适于创建多层应用。系统具有完备的触发器、存储过程、规则以及完整性定义,支持优化查询,具有较好的数据安全性。
SQL Server是美国微软(Microsoft)公司推出的关系型数据库管理系统,诞生之初是为了与Oracle和MySQL等关系型数据库管理系统进行竞争。
DB2是美国IBM公司最初于1983年研发的一套关系型数据库管理系统,与此同时DB2也是IBM公司第一款商用数据库。DB2是一个关系数据库管理系统(RDBMS),主要用于有效地存储、分析和检索数据,此外,通过支持面向对象特性和XML的非关系型结构,使得DB2产品得以扩展。如今,DB2是IBM信息管理组合中不可或缺的一部分。它是一个功能全面、高性能的数据库引擎,能够处理大量数据并同时为许多用户提供服务。
Oracle Database,又名Oracle RDBMS,或简称Oracle。是美国Oracle公司(甲骨文)公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。