SQL最基本的四种语句
掌握SQL四条最基本的数据*作语句:Insert,Select,Update和Delete。
练掌握SQL是数据库用户的宝贵财 富。在本文中,我们将引导你掌握四条最基本的
数据*作语句—SQL的核心功能—来依次介绍比较*作符、选择断言以及三值逻辑。当你
完成这些学习后,显然你已经开始算是精通SQL了。
在我们开始之前,先使用CREATE TABLE语句来创建一个表。DDL语句对数据库对象
如表、列和视进行定义。它们并不对表中的行进行处理,这是因为DDL语句并不处理数
据库中实际的数据。这些工作由另一类SQL语句—数据*作语言(DML)语句进行处理。
SQL中有四种基本的DML*作:INSERT,SELECT,UPDATE和DELETE。由于这是大多数
SQL用户经常用到的,我们有必要在此对它们进行一一说明。我们给出了一个名为
EMPLOYEES的表。其中的每一行对应一个特定的雇员记录。请熟悉这张表,我们在后面
的例子中将要用到它。
INSERT语句
用户可以用INSERT语句将一行记录插入到指定的一个表中。例如,要将雇员John
Smith的记录插入到本例的表中,可以使用如下语句:
INSERT INTO EMPLOYEES VALUES
('Smith','John','1980-06-10',
'Los Angles',16,45000);
通过这样的INSERT语句,系统将试着将这些值填入到相应的列中。这些列按照我们
创建表时定义的顺序排列。在本例中,第一个值“Smith”将填到第一个列LAST_NAME中
;第二个值“John”将填到第二列FIRST_NAME中……以此类推。
我们说过系统会“试着”将值填入,除了执行规则之外它还要进行类型检查。如果
类型不符(如将一个字符串填入到类型为数字的列中),系统将拒绝这一次*作并返回
一个错误信息。
如果SQL拒绝了你所填入的一列值,语句中其他各列的值也不会填入。这是因为SQL
提供对事务的支持。一次事务将数据库从一种一致性转移到另一种一致性。如果事务的
某一部分失败,则整个事务都会失败,系统将会被恢复(或称之为回退)到此事务之前
的状态。
回到原来的INSERT的例子,请注意所有的整形十进制数都不需要用单引号引起来,
而字符串和日期类型的值都要用单引号来区别。为了增加可读性而在数字间插入逗号将
会引起错误。记住,在SQL中逗号是元素的分隔符。
同样要注意输入文字值时要使用单引号。双引号用来封装限界标识符。
对于日期类型,我们必须使用SQL标准日期格式(yyyy-mm-dd),但是在系统中可
以进行定义,以接受其他的格式。当然,2000年临近,请你最好还是使用四位来表示年
份。
既然你已经理解了INSERT语句是怎样工作的了,让我们转到EMPLOYEES表中的其他
部分:
INSERT INTO EMPLOYEES VALUES
('Bunyan','Paul','1970-07-04',
'Boston',12,70000);
INSERT INTO EMPLOYEES VALUES
('John','Adams','1992-01-21',
'Boston',20,100000);
INSERT INTO EMPLOYEES VALUES
('Smith','Pocahontas','1976-04-06',
'Los Angles',12,100000);
INSERT INTO EMPLOYEES VALUES
('Smith','Bessie','1940-05-02',
'Boston',5,200000);
INSERT INTO EMPLOYEES VALUES
('Jones','Davy','1970-10-10',
'Boston',8,45000);
INSERT INTO EMPLOYEES VALUES
('Jones','Indiana','1992-02-01',
'Chicago',NULL,NULL);
在最后一项中,我们不知道Jones先生的工薪级别和年薪,所以我们输入NULL(不
要引号)。NULL是SQL中的一种特殊情况,我们以后将进行详细的讨论。现在我们只需
认为NULL表示一种未知的值。
有时,像我们刚才所讨论的情况,我们可能希望对某一些而不是全部的列进行赋值。除
了对要省略的列输入NULL外,还可以采用另外一种INSERT语句,如下:
INSERT INTO EMPLOYEES(
FIRST_NAME, LAST_NAME,
HIRE_DATE, BRANCH_OFFICE)
VALUE(
'Indiana','Jones',
'1992-02-01','Indianapolis');
这样,我们先在表名之后列出一系列列名。未列出的列中将自动填入缺省值,如果
没有设置缺省值则填入NULL。请注意我们改变了列的顺序,而值的顺序要对应新的列的
顺序。如果该语句中省略了FIRST_NAME和LAST_NAME项(这两项规定不能为空),SQL*
作将失败。
让我们来看一看上述INSERT语句的语法图:
INSERT INTO table
[(column { ,column})]
VALUES
(columnvalue [{,columnvalue}]);
和前一篇文?幸谎?,我们用方括号来表示可选项,大括号表示可以重复任意次数的
项(不能在实际的SQL语句中使用这些特殊字符)。VALUE子句和可选的列名列表中必须
使用圆括号。
SELECT语句
SELECT语句可以从一个或多个表中选取特定的行和列。因为查询和检索数据是数据
库管理中最重要的功能,所以SELECT语句在SQL中是工作量最大的部分。实际上,仅仅
是访问数据库来分析数据并生成报表的人可以对其他SQL语句一窍不通。
SELECT语句的结果通常是生成另外一个表。在执行过程中系统根据用户的标准从数
据库中选出匹配的行和列,并将结果放到临时的表中。在直接SQL(direct SQL)中,
它将结果显示在终端的显示屏上,或者将结果送到打印机或文件中。也可以结合其他
SQL语句来将结果放到一个已知名称的表中。
SELECT语句功能强大。虽然表面上看来它只用来完成本文第一部分中提到的关系代
数运算“选择”(或称“限制”),但实际上它也可以完成其他两种关系运算—“投影
”和“连接”,SELECT语句还可以完成聚合计算并对数据进行排序。
SELECT语句最简单的语法如下:
SELECT columns FROM tables;
当我们以这种形式执行一条SELECT语句时,系统返回由所选择的列以及用户选择的
表中所有指定的行组成的一个结果表。这就是实现关系投影运算的一个形式。
让我们看一下使用EMPLOYEES表的一些例子(这个表是我们以后所有SELECT语句实
例都要使用的。而我们在图2和图3中给出了查询的实际结果。我们将在其他的例子中使
用这些结果)。
假设你想查看雇员工作部门的列表。那下面就是你所需要编写的SQL查询:
SELECT BRANCH_OFFICE FROM EMPLOYEES;
由于我们在SELECT语句中只指定了一个列,所以我们的结果表中也只有一个列。注
意结果表中具有重复的行,这是因为有多个雇员在同一部门工作(记住SQL从所选的所
有行中将值返回)。要消除结果中的重复行,只要在SELECT语句中加上DISTINCT子句:
SELECT DISTINCT BRANCH_OFFICE
FROM EMPLOYEES;
现在已经消除了重复的行,但结果并不是按照顺序排列的。如果你希望以字母表顺
序将结果列出又该怎么做呢?只要使用ORDER BY子句就可以按照升序或降序来排列结果
:
SELECT DISTINCT BRANCH_OFFICE
FROM EMPLOYEES
ORDER BY BRANCH_OFFICE ASC;
这一查询的结果如表4所示。请注意在ORDER BY之后是如何放置列名BRANCH
_OFFICE的,这就是我们想要对其进行排序的列。为什么即使是结果表中只有一个列时
我们也必须指出列名呢?这是因为我们还能够按照表中其他列进行排序,即使它们并不
显示出来。列名BRANCH_ OFFICE之后的关键字ASC表示按照升序排列。如果你希望以降
序排列,那么可以用关键字DESC。
同样我们应该指出ORDER BY子句只将临时表中的结果进行排序;并不影响原来的表
。
假设我们希望得到按部门排序并从工资最高的雇员到工资最低的雇员排列的列表。
除了工资括号中的内容,我们还希望看到按照聘用时间从最近聘用的雇员开始列出的列
表。以下是你将要用到的语句:
SELECT BRANCH_OFFICE,FIRST_NAME,
LAST_NAME,SALARY,HIRE_DATE
FROM EMPLOYEES
ORDER BY SALARY DESC,
HIRE_DATE DESC;
这里我们进行了多列的选择和排序。排序的优先级由语句中的列名顺序所决定。
SQL将先对列出的第一个列进行排序。如果在第一个列中出现了重复的行时,这些行将
被按照第二列进行排序,如果在第二列中又出现了重复的行时,这些行又将被按照第三
列进行排序……如此类推。这次查询的结果如表5所示。
将一个很长的表中的所有列名写出来是一件相当麻烦的事,所以SQL允许在选择表
中所有的列时使用*号:
SELECT * FROM EMPLOYEES;
这次查询返回整个EMPLOYEES表,如表1所示。
下面我们对开始时给出的SELECT语句的语法进行一下更新(竖直线表示一个可选项
,允许在其中选择一项。):
SELECT [DISTINCT]
(column [{, columns}]) *
FROM table [ {, table}]
[ORDER BY column [ASC] DESC
[ {, column [ASC] DESC }]];
定义选择标准
在我们目前所介绍的SELECT语句中,我们对结果表中的列作出了选择但返回的是表
中所有的行。让我们看一下如何对SELECT语句进行限制使得它只返回希望得到的行:
SELECT columns FROM tables [WHERE predicates];
WHERE子句对条件进行了设置,只有满足条件的行才被包括到结果表中。这些条件
由断言(predicate)进行指定(断言指出了关于某件事情的一种可能的事实)。如果
该断言对于某个给定的行成立,该行将被包括到结果表中,否则该行被忽略。在SQL语
句中断言通常通过比较来表示。例如,假如你需要查询所有姓为Jones的职员,则可以
使用以下SELECT语句:
SELECT * FROM EMPLOYEES
WHERE LAST_NAME = 'Jones';
LAST_NAME = 'Jones'部分就是断言。在执行该语句时,SQL将每一行的LAST_NAME
列与“Jones”进行比较。如果某一职员的姓为“Jones”,即断言成立,该职员的信息
将被包括到结果表中
使用最多的六种比较
我们上例中的断言包括一种基于“等值”的比较(LAST_NAME = 'Jones'),但是
SQL断言还可以包含其他几种类型的比较。其中最常用的为:
等于 =
不等于 <>
小于 <
大于 >
小于或等于 <=
大于或等于 >=
下面给出了不是基于等值比较的一个例子:
SELECT * FROM EMPLOYEES
WHERE SALARY > 50000;
这一查询将返回年薪高于$50,000.00的职员(参见表7)。
逻辑连接符
有时我们需要定义一条不止一种断言的SELECT语句。举例来说,如果你仅仅想查看
Davy Jones的信息的话,表6中的结果将是不正确的。为了进一步定义一个WHERE子句,
用户可以使用逻辑连接符AND,OR和NOT。为了只得到职员Davy Jones的记录,用户可以
输入如下语句:
SELECT * FROM EMPLOYEES
WHERE LAST_NAME = 'Jones' AND FIRST_NAME = 'Davy';
在本例中,我们通过逻辑连接符AND将两个断言连接起来。只有两个断言都满足时
整个表达式才会满足。如果用户需要定义一个SELECT语句来使得当其中任何一项成立就
满足条件时,可以使用OR连接符:
SELECT * FROM EMPLOYEES
WHERE LAST_NAME = 'Jones' OR LAST_NAME = 'Smith';
有时定义一个断言的最好方法是通过相反的描述来说明。如果你想要查看除了
Boston办事处的职员以外的其他所有职员的信息时,你可以进行如下的查询:
SELECT * FROM EMPLOYEES
WHERE NOT(BRANCH_OFFICE = 'Boston');
关键字NOT后面跟着用圆括号括起来的比较表达式。其结果是对结果取否定。如果
某一职员所在部门的办事处在Boston,括号内的表达式返回true,但是NOT*作符将该值
取反,所以该行将不被选中。
断言可以与其他的断言嵌套使用。为了保证它们以正确的顺序进行求值,可以用括
号将它们括起来:
SELECT * FROM EMPLOYEES
WHERE (LAST_NAME = 'Jones'
AND FIRST_NAME = 'Indiana')
OR (LAST_NAME = 'Smith'
AND FIRST_NAME = 'Bessie');
SQL沿用数学上标准的表达式求值的约定—圆括号内的表达式将最先进行求值,其
他表达式将从左到右进行求值。
以上对逻辑连接符进行了说明,在对下面的内容进行说明之前,我们再一次对
SELECT语句的语法进行更新:
SELECT [DISTINCT]
(column [{, column } ] ) *
FROM table [ { , table} ]
[ORDER BY column [ASC] [DESC
[{ , column [ASC] [DESC } ] ]
WHERE predicate [ { logical-connector predicate } ];
NULL和三值逻辑
在SQL中NULL是一个复杂的话题,关于NULL的详细描述更适合于在SQL的高级教程而
不是现在的入门教程中进行介绍。但由于NULL需要进行特殊处理,并且你也很可能会遇
到它,所以我们还是简略地进行一下说明。
首先,在断言中进行NULL判断时需要特殊的语法。例如,如果用户需要显示所有年
薪未知的职员的全部信息,用户可以使用如下SELECT语句:
SELECT * FROM EMPLOYEES
WHERE SALARY IS NULL;
相反,如果用户需要所有已知年薪数据的职员的信息,你可以使用以下语句:
SELECT * FROM EMPLOYEES
WHERE SALARY IS NOT NULL;
请注意我们在列名之后使用了关键字IS NULL或IS NOT NULL,而不是标准的比较形
式:COLUMN = NULL、COLUMN <> NULL或是逻辑*作符NOT(NULL)。
这种形式相当简单。但当你不明确地测试NULL(而它们确实存在)时,事情会变得
很混乱。
例如,回过头来看我们图1中的EM-PLOYEES表,可以看到Indiana Jones的工薪等级
或年薪值都是未知的。这两个列都包含NULL。可以想象运行如下的查询:
SELECT * FROM EMPLOYEES
WHERE GRADE <= SALARY;
此时,Indiana Jones应该出现在结果表中。因为NULL都是相等的,所以可以想象
它们是能够通过GRADE小于等于SALARY的检查的。这其实是一个毫无疑义的查询,但是
并没有关系。SQL允许进行这样的比较,只要两个列都是数字类型的。然而,Indiana
Jones并没有出现在查询的结果中,为什么?
正如我们早先提到过的,NULL表示未知的值(而不是象某些人所想象的那样表示一
个为NULL的值)。对于SQL来说意味着这个值是未知的,而只要这个值为未知,就不能
将其与其他值比较(即使其他值也是NULL)。所以SQL允许除了在true 和false之外还
有第三种类型的真值,称之为“非确定”(unknown)值。
如果比较的两边都是NULL,整个断言就被认为是非确定的。将一个非确定断言取反
或使用AND或OR与其他断言进行合并之后,其结果仍是非确定的。由于结果表中只包括
断言值为“真”的行,所以NULL不可能满足该检查。从而需要使用特殊的*作符IS NULL
和IS NOT NULL。
UPDATE语句
UPDATE语句允许用户在已知的表中对现有的行进行修改。
例如,我们刚刚发现Indiana Jones的等级为16,工资为$40,000.00,我们可以通
过下面的SQL语句对数据库进行更新(并清除那些烦人的NULL)。
UPDATE EMPLOYEES
SET GRADE = 16, SALARY = 40000
WHERE FIRST_NAME = 'Indiana'
AND LAST_NAME = 'Jones';
上面的例子说明了一个单行更新,但是UPDATE语句可以对多行进行*作。满足WHERE
条件的所有行都将被更新。如果,你想让Boston办事处中的所有职员搬到New York,你
可以使用如下语句:
UPDATE EMPLOYEES
SET BRANCH_OFFICE = 'New York'
WHERE BRANCH_OFFICE = 'Boston';
如果忽略WHERE子句,表中所有行中的部门值都将被更新为'New York'。
UPDATE语句的语法流图如下面所示:
UPDATE table
SET column = value [{, column = value}]
[ WHERE predicate [ { logical-connector predicate}]];
DELETE语句
DELETE语句用来删除已知表中的行。如同UPDATE语句中一样,所有满足WHERE子句
中条件的行都将被删除。由于SQL中没有UNDO语句或是“你确认删除吗?”之类的警告
,在执行这条语句时千万要小心。如果决定取消Los Angeles办事处并解雇办事处的所
有职员,这一卑鄙的工作可以由以下这条语句来实现:
DELETE FROM EMPLOYEES
WHERE BRANCH_OFFICE = 'Los Angeles';
如同UPDATE语句中一样,省略WHERE子句将使得*作施加到表中所有的行。
DELETE语句的语法流图如下面所示:
DELETE FROM table
[WHERE predicate [ { logical-connector predicate} ] ];
现在我们完成了数据*作语言(DML)的主要语句的介绍。我们并没有对SQL能完成
的所有功能进行说明。SQL还提供了许多的功能,如求平均值、求和以及其他对表中数
据的计算,此外SQL还能完成从多个表中进行查询(多表查询,或称之为连接)的工作
。这种语言还允许你使用GRANT和REVOKE命令控制使用者的数据访问权限。
创建表格:
SQL语言中的create table语句被用来建立新的数据库表格。create table语句的
使用格式如下:
create table tablename
(column1 data type,
column2 data type,
column3 data type);
如果用户希望在建立新表格时规定列的限制条件,可以使用可选的条件选项:
create table tablename
(column1 data type [constraint],
column2 data type [constraint],
column3 data type [constraint]);
举例如下:
create table employee
(firstname varchar(15),
lastname varchar(20),
age number(3),
address varchar(30),
city varchar(20));
简单来说,创建新表格时,在关键词create table后面加入所要建立的表格的名称
,然后在括号内顺次设定各列的名称,数据类型,以及可选的限制条件等。注意,所有
的SQL语句在结尾处都要使用“;”符号。
使用SQL语句创建的数据库表格和表格中列的名称必须以字母开头,后面可以使用
字母,数字或下划线,名称的长度不能超过30个字符。注意,用户在选择表格名称时不
要使用SQL语言中的保留关键词,如select, create, insert等,作为表格或列的名称
。
数据类型用来设定某一个具体列中数据的类型。例如,在姓名列中只能采用
varchar或char的数据类型,而不能使用number的数据类型。
SQL语言中较为常用的数据类型为:
char(size):固定长度字符串,其中括号中的size用来设定字符串的最大长度。
Char类型的最大长度为255字节。
varchar(size):可变长度字符串,最大长度由size设定。
number(size):数字类型,其中数字的最大位数由size设定。
Date:日期类型。
number(size,d):数字类型,size决定该数字总的最大位数,而d则用于设定该数
字在小数点后的位数。
最后,在创建新表格时需要注意的一点就是表格中列的限制条件。所谓限制条件就
是当向特定列输入数据时所必须遵守的规则。例如,unique这一限制条件要求某一列中
不能存在两个值相同的记录,所有记录的值都必须是唯一的。除unique之外,较为常用
的列的限制条件还包括not null和primary key等。not null用来规定表格中某一列的
值不能为空。primary key则为表格中的所有记录规定了唯一的标识符。