关系数据库是什么?
数字时代伊始,数据库就一直是商业计算的核心组成部分。事实上,关系数据库诞生于1970年。那一年,IBM的研究员E.F. Codd撰写了一篇论文,概述了主要的创作过程。自此以后,关系数据库日益流行,并最终成为标准。
最初的时候,数据库是扁平的。这意味着,信息存储在一个很长的文本文件中,该文件称为制表符分隔文件。在制表符分隔文件中,每个条目都由竖线(|)等特殊字符分隔开来。每个条目都包含了某个特定对象或人员的多条信息,每条信息称为字段。这些字段组合在一起,称为记录。文本文件的形式使得人们很难搜索特定信息,也很难创建仅包含每条记录中的某些特定字段的报表。以下这个示例便是由扁平数据库创建的文件:
姓氏, 名字, 年龄, 薪水|史密斯, 约翰, 35, 280 美元|多伊, 简, 28, 325 美元|布朗, 斯科特, 41, 265 美元|霍华德, 谢姆普, 48, 359 美元|泰勒, 汤姆, 22, 250 美元 |
可以看出,您必须按顺序搜索整个文件才能搜集到相关信息,例如年龄或薪水。而通过使用关系数据库,您就可以轻松地找到特定信息。它还允许您根据任意字段进行排序,以及生成仅包含每条记录中的某些特定字段的报表。关系数据库使用表来存储信息。标准的字段和记录表示成表中的列(字段)和行(记录)。请看以下示例:
姓氏 | 名字 | 城市 | 年龄 | 薪水 |
史密斯 | 约翰 | 3 | 35 | 280美元 |
多伊 | 简 | 1 | 28 | 325美元 |
布朗 | 斯科特 | 3 | 41 | 265美元 |
霍华德 | 谢姆普 | 4 | 48 | 359美元 |
泰勒 | 汤姆 | 2 | 22 | 250美元 |
在这个关系数据库示例中,由于数据以列的形式排列,因此可以快速比较薪水和年龄。关系数据库模型利用这种统一性,根据来自现有表中的所需信息构建全新的表。换句话说,它利用相似数据的关系来提高数据库的速度和通用性。
由于其他表的存在,该数据库名称中所指的“关系”部分得以发挥作用。典型的关系数据库通常具有10到1,000多个表。每个表都包含一个或多个特殊的列,且其他表可以使用这些列作为键,以便从相应的表中搜集信息。请看下面这个表,它将上一个表的“城市”一列的编号与城市的名称进行匹配。
城市编号 | 城市名称 |
1 | 波士顿 |
2 | 伦敦 |
3 | 纽约 |
4 | 洛杉矶 |
通过将这些信息存储在另一个表中,数据库可以再创建一个较小的表,其中的位置信息可由数据库中的其他表用于各种目的。典型的大型数据库,如亚马逊这样的大型网站所拥有的数据库,都包含数百或数千个类似的表,它们共同发挥作用,以便在任何时候都能快速找到所需的确切信息。
关系数据库是使用特殊的编程语言创建的,这种语言称为结构化查询语言(SQL),它是数据库互用性的标准。SQL是当今所有流行数据库应用程序的基础——从Access到Oracle,无一例外。
[责任编辑:小敏]