1970年在IBM圣何塞研究实验室工作的牛津大学的数学家 Edgar F. Codd 发表了一篇论文,展示了如何在不知道信息的结构或在数据库中的位置信息的情况下,如何访问存储在大型数据库中的信息。
在此之前,检索信息需要相对复杂的计算机知识,甚至是那些知道如何编写程序来获取特定信息的专家的服务——这是一项耗时且昂贵的任务。
数据库被用来一次又一次地检索相同的信息,并且以一种可预测的方式——如制造材料的清单——在当时已经很好地建立起来了。Codd所做的是打开了一个新的数据独立世界的大门。用户不必是专家,也不需要知道信息在哪里,也不需要知道计算机是如何检索到信息的。他们现在可以更专注于自己的业务,更少关注他们的电脑。
Codd称他的论文是“大型共享数据银行的数据关系模型”。计算机科学家称之为“革命性的想法”。
如今,关系数据库的易用性和灵活性使它们成为财务记录、制造和物流信息和人员数据的主要选择。大多数常规的数据交易——使用信用卡、交易股票、进行旅行预订、在线购买——都使用基于关系数据库理论。
Codd的关系模型起初备受争议;人们认为这个模型太过简单,它永远不会有好的表现。
减少输入每个项的次数,这对减少数据输入错误有好处。每个条目只存储一次,所以即使您犯了错误,您也必须只纠正一个条目。
Ray Boyce和我想设计一种查询语言,它具有Ted Codd的关系语言的表达能力,但更容易被那些在集合理论或形式逻辑方面不是专家的用户理解。
关系模型是一种谈论数据的很好的统一方式,允许比较系统、比较算法等等。它还利用了一些优美的数学理论。
数据,而不是程序,是唯一的事情——应用程序是暂时的,除了获取、操作和显示数据之外没有任何价值。数据是唯一有价值的东西。
Codd最大的成就是使数据库管理成为一门科学。他通过提供一个理论框架把领域放在了坚实的科学基础上,关系模型的各种重要的问题可以以科学的方式攻击。
Codd的想法催生了一个新的IBM产品家族,集中在IBM®DB2®数据库管理系统,以及行业标准计算机语言处理关系数据库,称为SQL。
据《纽约时报》的讣告Codd:关系数据专家曾在IBM DB2上成为Codd博士的一个商业伙伴--Chris Date说“…在Codd博士的工作之前电子数据库可以说完全特设和高度混乱,这也成为他进入商业产品的契机。”
与许多革命性的想法一样,关系数据库也不是很容易实现。
到20世纪60年代,世界上大量数据存储在新主机上——其中许多是IBM System/360机器——已经成为一个问题。主机计算很昂贵,通常每分钟花费数百美元。其中很大一部分成本是数据库管理的复杂性。
Codd从他的祖国英格兰来到美国时,他在计算机科学领域获得了博士学位,开始着手解决这个问题。他以一个非常简单的前提开始:他希望能够向计算机询求信息,然后让计算机找出信息存储的位置和方式,以及如何检索信息。
IBM的Don Chamberlin说,Codd的基本思想是“数据项之间的关系应该基于数据项的值,而不是单独指定的链接或嵌套。这个概念大大简化了查询的规范,并允许前所未有的灵活性以新的方式利用现有的数据集”。
未完