- 数据库 和 数据库管理系统
人们通常用数据库这个术语来代表他们使用的数据库软件,这是不正确的,也因此产生了许多混淆。确切地说,数据库软件应称为数据库管理系统( DBMS)。数据库是通过 DBMS 创建和操纵的容器,而具体它究竟是什么,形式如何,各种数据库都不一样。
- 模式
表具有一些特性,这些特性定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。描述表的这组信息就是所谓的模式( schema),模式可以用来描述数据库中特定的表,也可以用来描述整个数据库(和其中表的关系)。
简而言之,模式就是关于数据库和表的布局及特性的信息。
- 主键(Primary Key)
主键的要求:
- 任意两行都不具有相同的主键值。
- 主键不允许为空。
- 主键列中的值不允许修改或更新。
- 主键值不能重用(如果某行从表中删除,它的主键不能赋给以后的新行)
主键可以定义在表的一列上,也可以一起使用多个列合在一起作为主键。使用多个列作为主键时,只要保证不同记录的主键不完全相同即可,可以有部分值相同。
- SQL语句的分句
必须以分号 分隔。对于单条SQL语句,有些DBMS允许不加分号,但是有些不允许,建议总是加上分号为好。
- SQL不区分大小写
SQL不区分大小写,所以 和 和 效果是一样的。
- SQL语句本身不区分大小写,但是数据库名和表名是可能区分大小写的
因为SQL本身只是一个语言,是一个标准,所以SQL本身不区分大小写,但是数据库名和表名是有可能区分大小写的,不同的数据库厂商的设置不一样。
- SQL会自动忽略多余的空格
所以以下三种写法是一样的:
合理分行可以改善程序的可读性。
示例:
选择多个列时,一定要在列名之间加上逗号,但最后一个列名后不加,如果最后一个列名后加了逗号将出现错误。
示例:
在实际的应用中,如果不是必须,不要检索所有列,因为这样会降低程序的检索效率。
检索所有列的另外一个用处是,可以检索出你不知道名字的列。
示例:
这样,当检索结果中有完全相同的两行的时候,就会去掉重复的。
此原则也适用于同时选择多列。
示例:
也就是说 关键字同时作用于三行。
不同的数据库管理系统的实现是不一样的。
- 适用于MySQL、MariaDB、PostgreSQL或者SQLite写法
可以使用 指定起始位置。需要注意的是,数据库中的行是从第0行开始的。
在MySQL和MariaDB中, 语句可以进行简化,写成 。需要注意的是逗号前边的对应的是 ,逗号后边的数对应于 。
- 适用于Oracle的写法
三种注释方式
使用 子句进行排序。默认采用升序排列。
示例:
关于MySQL的 子句使用方法的官方文档:
MySQL :: MySQL 8.0 Reference Manual :: 3.3.4.4 Sorting Rows
-
另外, 子句必须是一条语句的最后一条子句,如果它不是最后的子句,将会出现错误信息。
-
可以通过没有选择的列进行排序
一般情况下我们都是根据 选择的列中的列进行排序,但是也可以使用没有选择的列进行排序。
可以对两个列进行排序。
示例:
先对 进行排序,如果 中出现了两个相同的值的话,就会通过 进行排序。如果 中的值都是唯一的,那么就不会按 排序。
示例:
这表示依次使用 和 进行排序。
虽然这种方式可行,但是不建议使用这种方式。因为,如果对SELECt中选择的列进行了修改而忘记了对ORDER BY 子句进行修改的话,那么可能出错。
在 子句中某列名后面加上 ,表示针对此列进行降序排列。也就是说, 只作用于它前边紧邻的一个列名。
示例:
在对文本性数据进行排序时, A 与 a 相同吗? a 位于 B 之前,还是 Z之后?这些问题不是理论问题,其答案取决于数据库的设置方式。
在字典( dictionary)排序顺序中, A 被视为与 a 相同,这是大多数数据库管理系统的默认行为。但是,许多 DBMS 允许数据库管理员在需要时改变这种行为(如果你的数据库包含大量外语字符,可能必须这样做)。
这里的关键问题是,如果确实需要改变这种排序顺序,用简单的 ORDERBY 子句可能做不到。你必须请求数据库管理员的帮助。
示例:
这条语句从 表中检索两个列,但不返回所有行,只返回 值为 3.49 的行。
数据也可以在应用层过滤,就是说SQL检索出超过实际需要的数据,发送给客户端,然后由客户端程序再进行筛选。这样做是可行的,但是有几个缺点:
- 浪费带宽
- 创建的应用可能不具备可伸缩性
- 客户端性能问题
- 其中有些的效果是一样的,比如 和 , 和 ,但是不同的数据库厂商的设置不一定相同,需要参阅相关的文档。比如 Microsoft Access 支持 而不支持 。
示例:
可以看到,WHERe子句中的条件括在了单引号中。单引号用来限定字符串。如果将将值与字符串类型的列进行比较,就需要限定引号。如果用来与数值进行比较的值不用引号。
示例:
确定值是否为 NULL,不能简单地检查是否= NULL。 SELECT 语句有一个特殊的 WHERe 子句,可用来检查具有 NULL 值的列。这个 WHERe 子句就是 子句。
示例:
许多 DBMS 扩展了标准的操作符集,提供了更高级的过滤选择。更多信息请参阅相应的 DBMS 文档。
当你使用 运算符过滤不包含指定值的所有行时,你可能希望值为NULL的行也显示出来,但是实际上值为NULL的行并不会显示出来,因为 有特殊的含义,数据库不知道它们是否匹配。
前边的 子句都只有一个条件,可以使用 操作符在一个 子句中使用多个条件。
使用 操作度之后,会筛选出同时满足所有条件的数据。
示例:
可以有多个过滤条件,如果有多个过滤条件,每两个条件之间都要加上 关键字。
使用 操作符之后,一条数据只要满足任意一个条件就会被过滤出来。
示例:
同样,使用 操作符也可以有多个过滤条件。
考虑以下代码:
操作符在求值中优先级更高,所以这段代码表示过滤出“ 为 的数据,或者 为 且 大于等于 的数据。”
如果想要表达的是下面这个意思:
过滤出 为 或者 ,而且 都在 以上的数据。
那么就要把代码改成这样:
操作符用来指定条件范围,范围中的每个条件都可以进行匹配。
示例:
其实 操作符和 操作符可以执行相同的功能。不过 操作符有以下几个优点:
- 相比于使用 操作符连接多个条件, 操作符的语句更清晰简洁
- 操作符一般比使用多个 操作符执行得更快
- 后面可以包含其他 语句,能够更动态地建立 子句。
操作符一般放在条件的前边,用来否定后面的条件。
这段代码
和这段代码
表达同样的意思。
补充说明: 中的
允许使用 子句否定 、、 子句。大多数DBMS允许使用 否定任何条件。
使用 操作符来使用通配符(wildcard)进行搜索。用来进行匹配的字符串叫做 。
最常使用的通配符是百分号(%)。在搜索串中,%表示任何字符出现任意次数。任意次数就意味着可以出现0次,1次或者多次。
这段代码
表示找出所有 以 为开头的数据。
通配符可以放在模式串的任意位置。
例如,模式串 表示匹配任何位置上包含文本 的值,不论它之前或者之后出现什么字符串。
需要注意的是,%不能匹配NULL,即 不会匹配产品名称为 的行。
通配符匹配任意单个字符。
方括号用来指定一个字符的集合,匹配这个这个集合中的任意一个字符。例如 表示匹配以 或 开头的数据。
可以在 中开头加上 表示匹配除了这个集合中的字符以外的任意字符。例如 表示匹配不以 或者 开头的任意字符。这种功能也可以换一种实现方式,使用 ,即 。
通配符有时候可以很方便,但是这种方便是有代价的,使用通配符进行搜索一般前面介绍的其他搜索要耗费更长的处理时间。最好遵守以下原则:
- 不要过度使用通配符,如果使用其他操作符能够达到目的,就不要使用通配符
- 确实需要使用通配符时,尽量不要把它们用在模式串的开头。把通配符放到模式串的开头,搜索起来是最慢的。
SQL Server和Access的写法
DB2、Oracle、PostgreSQL、SQLite、Open Office base的写法
MySQL和MariaDB的写法
输出结果
输入
或
输出结果
说明:TRIM 函数
大多数 DBMS 都支持 RTRIm() (正如刚才所见,它去掉字符串右边的空格) 、 LTRIm() (去掉字符串左边的空格)以及 TRIm() (去掉字符串左右两边的空格) 。
使用 关键字为筛选出来的数据赋予一个别名。
- 在很多DBMS中,AS关键字是可选的,不过最好使用它,这被视为一条最佳实践。
- 别名还有其他用途。常见的用途包括在实际的表列名包含不合法的字符(如空格)时重新命名它,在原来的名字含混或容易误解时扩充它。
- 别名的名字既可以是一个单词,也可以是一个字符串。如果是后者,字符串应该括在引号中。虽然这种做法是合法的,但不建议这么去做。多单词的名字可读性高,不过会给客户端应用带来各种问题。因此,别名最常见的使用是将多个单词的列名重命名为一个单词的名字。
输出:
其中, 为一个计算字段,也就是 。
SQL支持在 语句中直接使用算术运算符 、、、。
SELECT 语句为测试、 检验函数和计算提供了很好的方法。 虽然 SELECT通常用于从表中检索数据, 但是省略了 FROM 子句后就是简单地访问和处理表达式,例如 SELECT 3 * 2; 将返回 6, SELECT Trim(’ abc ');将返回 abc , SELECT Now(); 使用 Now() 函数返回当前日期和时间。现在你明白了,可以根据需要使用 SELECT 语句进行检验。
不同的DBMS中的函数是不同的,但是有一些基本的共同的函数。
函数不仅仅可以在SELECT子句中,还可以出现在WHERe等子句中。
为了代码的可移植,许多 SQL 程序员不赞成使用特定于实现的功能。虽然这样做很有好处,但有的时候并不利于应用程序的性能。如果不使用这些函数,编写某些应用程序代码会很艰难。必须利用其他方法来实现DBMS可以非常有效完成的工作。
如果你要是用函数,记得做好注释,以便之后的修改。
函数
输入:
输出:
函数
输入:
输出:
SOUNDEX 是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。 SOUNDEX 考虑了类似的发音字符和音节,使得能对字符串进行发音比较而不是字母比较。虽然 SOUNDEX 不是 SQL 概念,但多数 DBMS 都提供对 SOUNDEX的支持。
使用 子句创建分组。
输入:
输出:
聚集函数针对分组作用,而不是针对所有的行作用。
一些注意事项:
- GROUP BY 子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致地进行数据分组。
- 如果在 GROUP BY 子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。
- GROUP BY 子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数) 。 如果在 SELECT 中使用表达式, 则必须在 GROUP BY子句中指定相同的表达式。不能使用别名。
- 大多数 SQL 实现不允许 GROUP BY 列带有长度可变的数据类型(如文本或备注型字段)。
- 除聚集计算语句外, SELECT 语句中的每一列都必须在 GROUP BY 子句中给出。
- 如果分组列中包含具有 NULL 值的行,则 NULL 将作为一个分组返回。如果列中有多行 NULL 值,它们将分为一组。
- GROUP BY 子句必须出现在 WHERe 子句之后, ORDER BY 子句之前。
和 的区别
-
也用于数据的过滤,但是 是基于行进行过滤的。
不仅可以基于行进行过滤,还可以基于分组进行过滤。但是 一般只用于过滤分组。
-
在数据分组前进行过滤, 在数据分组后进行过滤。这是一个重要的区别, 排除的行不包括在分组中。这可能会改变计算值,从而影响 子句中基于这些值过滤掉的分组。
示例
输入:
输出:
提示:不要忘记 ORDER BY