Chapter 4. SQL 语法
Table of Contents
4.1. 词法结构
4.1.1. 标识符和关键字
4.1.2. 常量
4.1.3. 操作符
4.1.4. 特殊字符
4.1.5. 注释
4.1.6. 词法优先级
4.2. 值表达式
4.2.1. 字段引用
4.2.2. 位置参数
4.2.3. 下标
4.2.4. 字段选择
4.2.5. 操作符调用
4.2.6. 函数调用
4.2.7. 聚集表达式
4.2.8. 类型转换
4.2.9. 标量子查询
4.2.10. 数组构造器
4.2.11. 行构造
4.2.12. 表达式计算规则
本章描述 SQL 的语法。 这些内容是理解随后各章的基础,那些章里面将详细介绍 SQL 命令如何用于定义和修改数据。
我们也建议那些已经很熟悉 SQL 的用户仔细阅读本章,因为有一些规则和概念在 SQL 数据库之间实现得并不一致,或者是有些东西是 PostgreSQL 特有的。
4.1. 词法结构
SQL 输入由一系列命令组成。 一条命令是由一系列记号构成, 用一个分号(";")结尾。 输入流的终止也结束一条命令。哪些记号是合法的取决于特定命令的语法。
记号可以是一个关键字, 一个标识符,一个 引号包围的标识符, 一个文本(或常量),或者是特殊的字符符号。 记号通常由空白分隔(空格,tab,换行符),但如果不存在混淆的时候也可以不用 (通常只是一个特殊字符与一些其它记号类型相联的时候)。
另外,在 SQL 输入里可以有注释。 它们不是记号,它们实际上等效于空白。
比如,下列命令是(语法上)合法的 SQL 输入:
SELECT * FROM MY_TABLE;
UPDATE MY_TABLE SET A = 5;
INSERT INTO MY_TABLE VALUES (3, 'hi there');
这里是三条命令的序列,每条一行(尽管并不要求这么做; 多条命令可以在一行里,并且命令可以合理地分裂成多个行)。
如果从哪些记号标识命令,哪些是操作数或参数的角度考虑, SQL 语法并不是非常一致。通常头几个记号是命令名字,因此上面的例子我们通常可以说是一个"SELECT", 一个"UPDATE",和一个"INSERT"命令。 不过, UPDATE 命令总是要求一个 SET 在某个位置出现,并且这个变体的 INSERT 还要求有一个 VALUES 才完整。每条命令的准确语法规则都在 Part VI 里描写。
4.1.1. 标识符和关键字
象上面的例子里的 SELECT,UPDATE, 或 VALUES 这样的记号都是关键字的例子, 也就是那些在 SQL 语言里有固定含义的单词。 记号 MY_TABLE 和 A 是标识符的例子。根据使用它们的命令的不同,它们标识表,字段,或者其它数据库对象的名字。 因此,有时候只是简单地叫它们"名字"。关键字和标识符有着同样的词法结构,意思是我们在没有认识这种语言之前是无法区分一个记号是标识符还是名字。 你可以在 Appendix C 里找到一个关键字的完整列表。
SQL 标识符和关键字必须以一个字母开头 (a-z 以及带可区别标记的字母以及非拉丁字母 )或下划线开头 (_)开头。标识符和关键字里随后的字符可以是字母,数字(0-9), 或者下划线,但 SQL 标准不会定义包含数字或者以下划线开头或结尾的关键字。
系统使用不超过 NAMEDATALEN-1 个字符作为标识符; 你可以在命令中写更长的名字,但它们会被截断。缺省时, NAMEDATALEN 是 64,因此标识符最大长度是 63 如果觉得这个限制有问题,那么你可以在 src/include/postgres_ext.h 里修改 NAMEDATALEN 来改变它。
标识符和关键字名字都是大小写无关的。因此
UPDATE MY_TABLE SET A = 5;
也可以等效地写成
uPDaTE my_TabLE SeT a = 5;
一种好习惯是把关键字写成大写,而名字等用小写。
UPDATE my_table SET a = 5;
还有第二种标识符:分隔标识符 或引号包围的标识符。 它是通过在双引号(" ) 里包围任意字符序列形成的。分隔标识符总是一个标识符,而不是关键字。因此,你可以用 "SELECT" 表示一个字段名字或者名字叫 "SELECT" 的表,而一个没有引号的 SELECT 将被当做一条命令的一部分,因此如果把它当做一个表的名字或者字段名字用的话就会产生一个分析错误。上面的例子可以用引起的标识符这么写:
UPDATE "my_table" SET "a" = 5;
引号包围的标识符可以包含除引号本身以外的任何其它字符。 要包含一个双引号,我们可以写两个双引号。 这样我们就可以构造那些原本是不允许的表或者字段名字, 比如那些包含空白或与号的名字。但长度限制依旧。
把一个标识符用引号包围的起来同时也令它大小写相关,而没有引号包围起来的名字总是转成小写。 比如,我们认为标识符 FOO,foo 和 "foo" 是一样的 PostgreSQL名字, 但 "Foo" 和 "FOO" 与上面三个以及它们之间都是不同的。 (PostgreSQL 里对未加引号的名子总是转换成小写, 这和 SQL 是不兼容的,SQL 里要求未用引号包围起来的名字总是转成大写。 因此 foo 等于 "FOO"。 如果你想写可移植的程序,那么我们建议你要么就总是引号包围的某个名字,要么就坚决不引。)
4.1.2. 常量
在 PostgreSQL 里有三种隐含类型的常量: 字符串,位串,和数值。 常量也可以声明为明确的类型,这样就可以使用更准确的表现形式以及可以通过系统更有效地处理。 这些候选的在后面的小节描述。
4.1.2.1. 字符串常量
SQL 里的一个字串文本是用单引号(')包围的任意字符序列, 比如,'This is a string'。 这种声明字串常量的方法是 SQL 标准定义的。 在这种类型的字串常量里嵌入单引号的标准兼容的做法是敲入两个连续的单引号比如,'Dianne''s horse'。另外,PostgreSQL 允许用用一个反斜杠("\'")来逃逸单引号, 因此同一个字串可以写成'Dianne\'s horse'。不过,将来版本的 PostgreSQL 将不允许这么用, 所以使用反斜扛的应用应该转换成上面说的标准兼容的方法。
另外一个 PostgreSQL 扩展是还可以使用 C-风格的反斜杠逃逸: \b 是一个退格,\f 是一个进纸,\n 是一个换行符, \r 是一个回车,\t 是一个水平制表符。 还支持 \digits, 这里 digits 是一个八进制字节数值, 还支持 \xhexdigits,这里的 hexdigits 代表十六进制字节值。 (你创建的字节序列是否服务器的字符集编码能接受的正确字符,是你自己的责任。)任何其它跟在反斜杠后面的字符都当做文本看待。 因此,要在字符串常量里包含反斜杠,则写两个反斜杠。
注意: 虽然现在的普通字串支持 C 风格的反斜扛逃逸, 将来版本讲对这样使用发出警告,并且最后将认为反斜扛是标准兼容的文本字符。声明逃逸处理的比较好的方法是使用逃逸字串语法,表示需要进行逃逸处理。 逃逸字串语法是通过在字串前写字母 E (大写或者小写)的方法声明的。比如,E'\041'。这个方法将在所有将来版本的 PostgreSQL 里起作用。
编码为零的字符不能出现在字符串常量中。
两个只是通过至少有一个换行符的空白分隔的字符串常量会被连接在一起,并当做它们是写成一个常量处理。 比如:
SELECT 'foo'
'bar';
等效于
SELECT 'foobar';
而
SELECT 'foo' 'bar';
是非法的语法,(这个略微有些怪异的行为是 SQL 声明的; PostgreSQL 遵循标准。)
4.1.2.2. 美元符包围字串常量
尽管声明字串常量的标准方法通常都很方便,但是如果字串包含很多单引号或者反斜杠,那么理解字串的内容可能就会变得很苦涩,因为每个单引号都要加倍。 为了让这种场合下的查询更具可读性,PostgreSQL 允许另外一种称作"美元符包围"的字串常量声明办法。 一个通过美元符包围声明的字串常量由一个美元符号($),一个可选的零个或多个字符"记号",另外一个美元符号,一个组成字串常量的任意字符的序列,一个美元符号,以及一个和开始这个美元符包围的记号相同的记号,和一个美元符号组成。比如,下面是两个不同的方法,用美元符包围声明了前面的例子:
$$Dianne's horse$$
$SomeTag$Dianne's horse$SomeTag$
请注意,在美元符包围的字串里,单引号可以不用逃逸使用。 实际上,在一个美元符包围的字串里,没有什么字符需要逃逸: 字串内容总是按照字面内容写。反斜杠不是特殊的, 美元符自己也不是特殊的,除非它们和开标签的一部分匹配。
我们可以通过在不同嵌套级别使用不同的美元符引号字串常量来实现嵌套。 最常见的是写函数定义的时候。比如:
$function$
BEGIN
RETURN ($1 ~ $q$[\t\r\n\v\\]$q$);
END;
$function$
这里,序列 $q$[\t\r\n\v\\]$q$ 表示一个美元符包围的字串文本 [\t\r\n\v\\], 在函数体被 PostgreSQL 执行的时候,它将被识别出来。 但是因为这个序列不匹配外层的美元符分隔符$function$,所以只要考虑了外层字串,它就只是常量里面的一些额外的字符而已。
如果有标签的话,一个美元符包围的字串遵循和无引号包围的标识符相同的规则, 只是它不能包含美元符。标签是大小写相关的,因此 $tag$String content$tag$ 是正确的,而 $TAG$String content$tag$ 不对。
一个后面跟着关键字或者标识符的美元包围的字串必须用空白隔开; 否则美元符包围分隔符将会被认为前面标识符的一部分。
美元符包围不是 SQL 标准,但是在写复杂的字串文本的时候,它通常比标准的单引号语法更方便。尤其是在其它常量里表现字串常量的时候更有用,比如经常在过程函数定义里面的。如果用单引号语法,每个上面例子里的反斜杠都必须写四个,它们在作为字串文本分析的时候会减少为两个,然后在函数执行的时候在内层字串常量里会再次被解析为一个。
4.1.2.3. 位串常量
位串常量看起来很象在开引号前面有一个 B (大写或小写)的普通字符串(它们之间没有空白), 比如 B'1001'。位串常量里可以用的字符只有 0 和 1。
另外,位串常量可以用十六进制表示法声明,方法是使用前缀的 X (大写或者小写),比如,X'1FF'。 这种表示法等效于一个每个十六进制位四个二进制位的位串常量。
两种形式的位串常量都可以象普通字串常量那样跨行连续。 美元符包围不能用于位串常量。
4.1.2.4. 数值常量
数值常量接受下列通用的形式:
digits
digits.[digits][e[+-]digits]
[digits].digits[e[+-]digits]
digitse[+-]digits
这里的 digits 是一个或多个十进制位(0 到 9)。如果有小数点,那么至少有一位在小数点前面或后面。如果出现了指数分隔符(e),那么至少有一个位跟在它后面。在常量里不能有空格或者其他字符嵌入在内。 请注意任何前导地正号或者负号实际上都不认为是常量的一部分; 它是施加于常量的一个操作符。
这里是一些合法的数值常量的例子:
42
3.5
4.
.001
5e2
1.925e-3
如果一个数值常量既不包含小数点,也不包含指数操作符, 那么如果它的数值可以放在integer类型中(32位),则认为它是integer类型;如果它的数值可以放在 bigint中(64位),则认为它是 bigint; 否则认为它是 numeric类型。包含小数点和/或指数操作符的常量总是被认为是numeric类型。
给一个数值常量赋予初始数据类型只是类型解析算法的开端。 在大多数情况下该常量会根据环境被自动强制转换成最合适的类型。必要时,你可以通过强制类型转换把一个数值解析成特定的数据类型。比如,你可以强制要求把一个数值当作类型real(float4)来看,方法是这么写:
REAL '1.23' -- 字串风格
'1.23'::REAL -- PostgreSQL (历史原因)风格
这些实际上只是下面讨论的通用转换的特例。
4.1.2.5. 其它类型的常量
任意类似的常量可以用下列表示法中的任何一种来输入:
type 'string'
'string'::type
CAST ( 'string' AS type )
在字串常量的文本将传递给那种叫 type 的类型的输入转换过程。 结果是这种类型的一个常量。如果不存在该常量所属类型的歧义, 那么明确的类型映射可以省略(比如,当你把它直接赋予一个表字段的时候), 这种情况下它会自动转换。
字串常量可以用普通 SQL 表示法或者美元符包围来书写。
我们还可以用函数样的语法来声明类型转换:
typename ( 'string' )
不过并非所有类型名可以这样使用;参阅 Section 4.2.8 获取细节。
::,CAST(),和函数调用语法也可以用于声明任意表达式的运行时类型转换, 如 Section 4.2.8 中讨论的那样。 但是 type 'string' 的形式只能用于声明一个文本常量的类型。 type 'string' 的另外一个限制是它不能用于数组类型;要用 :: 或者 CAST() 声明一个数组常量的类型。
CAST() 语法遵循 SQL。 type 'string' 语法是标准的一个推广:SQL 只是给少数几种数据类型声明了这个语法, 但 PostgreSQL 允许将其用于所有类型。带 :: 的语法是 PostgreSQL 的历史用法,函数调用语法也是。
4.1.3. 操作符
一个操作符是最多 NAMEDATALEN-1 (缺省 63 个字符)个下列字符的序列:
+ - * / < > = ~ ! @ # % ^ & | ` ?
不过,对操作符名字有几个限制:
-- 和 /* 不能出现在操作符名字中的任何地方,因为它们会被当做注释开始对待。
多字符操作符不能以 + 或 - 结束, 除非其名字至少还包含下列操作符之一:
~ ! @ # % ^ & | ` ?
比如,@- 是允许的操作符名字, 但 *- 不是。这个限制允许 PostgreSQL 在不要求记号之间有空白的情况下分析 SQL 兼容的查询。
当你使用非 SQL 标准的操作符名字的时候,你通常需要用空白分隔相邻的操作符以避免歧义。 比如,如果你定义了一个叫 "@" 的左单目操作符,那么你就不能写 X*@Y;而是要写成 X* @Y 以确保 PostgreSQL 把它读成两个操作符,而不是一个。
4.1.4. 特殊字符
有些非字母数字字符有一些特殊含义,因此不能用做操作符。 它们的用法的细节可以在相应的描述语法元素的地方找到。 本节只是描述它们的存在和概括一下这些字符的目的。
美元符号($)后面跟着数字用于在一个函数体定义或者准备好的语句中 表示参数的位置。在其他环境里美元符号可能是一个标识符名字或者是一个美元符包围的字串常量的一部分。
圆括弧(())用于分组和强制优先级的时候含义与平常一样。 有些场合里圆括弧是作为一个特定 SQL 命令的固定语法的一部分要求的。
方括弧([])用于选取数组元素。 参阅 Section 8.10 获取更多信息。
逗号(,在一些语法构造里用于分隔一个列表的元素。
分号(;)结束一条 SQL 命令。 它不能出现在一条命令里的任何地方,除非引号包围的来当做字符串常量或者标识符用。
冒号 (:)用于从数组中选取"片段"。(参阅 Section 8.10。)在一些 SQL 方言里(比如嵌入 SQL ), 冒号用于前缀变量名。
星号 (* 在某些环境里表示一个表行或者一个符合类型值的全部字段。 在用作聚集函数 COUNT 的参数时还有特殊含义。
句点 (.用在数字常量里,并用于分隔模式,表和字段名字。
4.1.5. 注释
注释是任意以双划线开头并延伸到行尾的任意字符序列,比如:
-- 这是标准的 SQL92 注释
另外,还可以使用 C-风格的块注释:
/* 多行注释
* 可以嵌套∶/* 嵌套的块注释 */
*/
这里注释以 /* 开头并扩展到对应的 */。这些块注释可以嵌套,就象 SQL99 里说的那样, 但和 C 不一样,因此我们可以注释掉一大块已经包含块注释的代码。
注释在进一步的语法分析之前被从输入流删除并用空白代替。
4.1.6. 词法优先级
Table 4-1 显示了 PostgreSQL 里面的操作符的优先级和关联性。 大多数操作符都有相同的优先级并且都是左关联的。这种情况可能会有不那么直观的行为;比如,布尔操作符 < 和 > 和布尔操作符 <= 和 >= 之间有着不同的优先级。同样,当你把双目和单目操作符组合使用的时候, 有时候也需要加圆括弧。比如
SELECT 5 ! - 6;
会被分析成
SELECT 5 ! (- 6);
因为分析器不知道 ! 定义成了后缀操作符, 而不是中缀操作符。― 知道的时候只能是太晚了 ― 要在本例中获得你需要的特性,你要写成
SELECT (5 !) - 6;
这是我们为扩展性付出的代价。
Table 4-1. 操作符优先级(递减)
操作符/元素 关联性 描述
. 左 表/字段名分隔符
:: 左 PostgreSQL-特有的类型转换操作符
[ ] 左 数组元素选则
- 右 单目负号
^ 左 幂操作
* / % 左 乘,除,模
+ - 左 加,减
IS 空 IS TRUE, IS FALSE, IS UNKNOWN, IS NULL
ISNULL 空 测试是否为空值
NOTNULL 空 测试是否为非空值
(任何其它的) 左 所有其它的本地和用户定义操作符
IN 空 集合成员
BETWEEN 空 范围包含
OVERLAPS 空 时间间隔重叠
LIKE ILIKE SIMILAR 空 字符串模式匹配
< > 空 小于,大于
= 右 等于,赋值
NOT 右 逻辑反
AND 左 逻辑与
OR 左 逻辑或
请注意操作符优先级也适用于和上面提到的同名的内置操作符用户定义操作符。 比如,如果你为一些客户数据类型定义一个 "+" 操作符, 那么它和内置的 "+" 操作符有同样的优先级,不管你干了什么。
如果在 OPERATOR 语法里使用了模式修饰的操作符名, 比如
SELECT 3 OPERATOR(pg_catalog.+) 4;
那么 OPERATOR 构造就会有 Table 4-1 表里面为"任何其它"操作符显示的缺省优先级。 不管什么特定的操作符出现在 OPERATOR()里,都是这样。
SQL语法
4.2. 值表达式
值表达式用在各种语法环境中,比如在 SELECT 命令的目标列表中,在 INSERT 或 UPDATE 中用做新的列值,或者在许多命令中的搜索条件中使用。 我们有时候把值表达式的结果叫做标量,以便与一个表表达式的结果相区别(是一个表)。因此值表达式也叫做标量表达式(或者更简单的表达式)。表达式语法允许对来自基本部分的数值进行算术,逻辑,集合,和其它操作的运算。
值表达式是下列内容之一:
一个常量或者文本值。
一个字段引用。
一个位置参数引用,在函数声明体中。
一个操作符调用。
一个函数调用。
一个聚集表达式。
一个类型转换。
一个标量子查询。
一个行构造器。
另外一个在圆括弧里面的值表达式,可以用于子表达式分组和覆盖优先级。
除了这个列表以外,还有许多构造可以归类为表达式,但是不遵循任何通用的语法规则。 它们通常有函数或操作符的语义,并且在 Chapter 9 里合适的位置描述。 一个例子是 IS NULL 子句。
我们已经在 Section 4.1.2 里有讨论过的内容了。下面的节讨论剩下的选项。
4.2.1. 字段引用
一个字段可以用下面形式的引用:
correlation.columnname
correlation 是一个表的名字(可能有模式修饰), 或者是用FROM子句这样的方法定义的表的别名,或者是关键字 NEW 或 OLD。 (NEW和 OLD只能出现在一条改写规则中, 而其他相关的名字可以用于任意 SQL 语句中。)如果在当前查询中所使用的所有表中,该字段名字是唯一的, 那么这个相关名字和分隔用的点就可以省略。 (又见 Chapter 7。)
4.2.2. 位置参数
位置参数引用用于标识从外部给一个 SQL 语句的一个参数。 参数用于 SQL 函数定义语句和准备好的查询。 有些客户端库还支持在 SQL 命令字串外边声明数据值,这种情况下参数用于引用 SQL 字串行外的数据。 一个参数的形式如下:
$number
比如,看看一个函数 dept 的定义, 如下
CREATE FUNCTION dept(text) RETURNS dept
AS $$ SELECT * FROM dept WHERE name = $1 $$
LANGUAGE SQL;
在函数被调用的时候这里的 $1 将引用第一个函数的参数。
4.2.3. 下标
如果一个表达式生成一个数组类型的数值,那么我们可以通过写下面这样的表达式来声明数组值的元素
expression[subscript]
如果是多个相邻的元素(一个"数组片断")可以用下面的方法抽取
expression[lower_subscript:upper_subscript]
(在这里,方括弧 [ ] 的意思是按照字面文本的方式出现。) 每个subscript自己都是一个表达式,它必须生成一个整数值。
通常,数组 expression 必须用圆括弧包围, 但如果要进行脚标计算的表达式只是一个字段引用或者一个位置参数,那么圆括弧可以省略。 同样,如果源数组是多维的,那么多个脚标可以连接在一起。比如,
mytable.arraycolumn
mytable.two_d_column[17][34]
$1[10:42]
(arrayfunction(a,b))[42]
最后一个例子里的圆括弧是必须的。参阅 Section 8.10 获取有关数组的更多信息。
4.2.4. 字段选择
如果一个表达式生成一个复合类型(行类型),那么用下面的方法可以抽取一个指定的字段
expression.fieldname
通常,行 expression 必须用圆括弧包围, 但是如果要选取的表达式只是一个表引用或者位置参数,可以省略圆括弧。 比如
mytable.mycolumn
$1.somecolumn
(rowfunction(a,b)).col3
(因此,一个全称的字段引用实际上只是一个字段选择语法的特例。)
4.2.5. 操作符调用
操作符调用有三种语法∶
expression operator expression (双目中缀操作符)
operator expression (单目前缀操作符)
expression operator (单目后缀操作符)
这里的 operator 记号遵循语法规则: Section 4.1.3, 或者是记号:AND, OR,和 NOT 之一。 或者是一个被修饰的操作符名
OPERATOR(schema.operatorname)
具体存在哪个操作符以及它们是单目还是双目取决于系统或用户定义了什么操作符。Chapter 9 描述了内置的操作符。
4.2.6. 函数调用
函数调用的语法是合法函数名字(可能有模式名修饰), 后面跟着在圆括弧里的它的参数列表:
function ([expression [, expression ... ]] )
比如,下面的代码计算 2 的平方根:
sqrt(2)
内置函数的列表在 Chapter 9 里。 其它函数可以由用户添加。
4.2.7. 聚集表达式
一个聚集表达式代表一个聚集函数对一个查询选出的行的处理。 一个聚集函数把多个输入缩减为一个输出值, 比如给输入求和或平均。一个聚集表达式的语法是下列之一:
aggregate_name (expression)
aggregate_name (ALL expression)
aggregate_name (DISTINCT expression)
aggregate_name ( * )
这里 aggregate_name 是前面定义的聚集,(可能是全称), 而 expression 是一个本身不包含聚集表达式的任意值表达式。
第一种形式的聚集表达式为所有表达式生成非空值的输入行调用聚集。 (实际上,是否忽略空值由聚集函数决定 ― 但是所有标准的聚集函数都忽略它们。) 第二种形式和第一种一样,因为 ALL 是缺省值。第三种形式为所有输入行里找到表达式的所有唯一的非空值调用聚集。 最后一种形式为每个输入行(不管是空还是非空)调用一次聚集;因为没有声明特定的输入值。通常它只是对 count() 聚集函数有用。
比如,count(*) 生成输入行的总数; count(f1) 生成 f1 为非空的输入行数; count(distinct f1) 生成 f1 唯一非空的行数。
预定义的聚集函数在 Section 9.15 里描述。 其它聚集函数可以由用户增加。
一个聚集表达式只能在 SELECT 命令的结果列表或者 HAVING 子句里出现。 禁止在其它子句里出现,比如 WHERE 里面,因为这些子句逻辑上在生成聚集结果之前计算。
如果一个聚集表达式出现在一个子查询里(参阅 Section 4.2.9 和 Section 9.16),聚集通常是在子查询的行上进行计算。但是如果聚集的参数只包含外层查询的变量则有一个例外:这个聚集会属于离他最近的外层查询,并且在该查询上进行计算。该聚集表达式整体上属于它出现的子查询对外层查询的引用,其作用相当于子查询任何一次计算中的一个常量。 这个聚集表达式的有关只能出现在结果列或者 HAVING 子句的限制适用于聚集所属的查询层。
4.2.8. 类型转换
一个类型转换声明一个从一种数据类型到另外一种数据类型的转换。 PostgreSQL 接受两种等效的类型转换语法:
CAST ( expression AS type )
expression::type
CAST 语法遵循 SQL;:: 的语法是 PostgreSQL 传统用法。
如果对一个已知类型的值表达式应用转换,它代表一个运行时类型转换。 只有在定义了合适的类型转换操作的情况下,该转换才能成功。请注意这一点和用于常量的转换略有区别,如 Section 4.1.2.5 所示。一个应用于某个未修饰的字串文本的转换表示给一个字串文本数值赋予一个初始化类型,因此它对于任何类型都会成功(如果字串文本的内容符合该数据类型的输入语法接受。)
如果对于一个值表达式生成的数值对某类型而言不存在混淆的情况, 那么我们可以省略明确的类型转换(比如,在给一个表字段赋值的时候);在这样的情况下,系统将自动附加一个类型转换。 不过,自动转换只适用于那些系统表中标记着 "OK to apply implicitly" 的转换函数。 其它转换函数必须用明确的转换语法调用。 这些限制是为了避免一些怪异的转换被应用。
我们也可以用函数样的语法声明一个类型转换:
typename ( expression )
不过,这个方法只能用于那些名字同时也是有效函数名字的类型。 比如,double precision 就不能这么用, 但是等效的 float8 可以。同样,interval, time,和 timestamp 如果加了双引号也只能这么用,因为存在语法冲突。因此,函数样的类型转换会导致不一致, 所以可能应该避免在新应用中这么用。(函数样语法实际上就似乎一个函数调用。如果使用两种标准转换语法做运行时转换, 那么它将在内部调用一个已注册得函数执行转换。通常,这种转换函数和它们得输出类型同名,但是这个要点可不是那些可以移植的程序可以依赖的东西。)
4.2.9. 标量子查询
一个标量子查询是一个放在圆括弧里的普通 SELECT查询, 它只返回只有一个字段的一行。(参阅 Chapter 7 获取有关写查询的信息。) 该 SELECT 将被执行, 而其单个返回值将在周围的值表达式中使用。把一个返回超过一行或者超过一列的查询用做标量查询是错误的。 (不过,在特定的执行中,子查询不返回行则不算错误;标量结果认为是NULL。)该子查询可以引用周围查询的变量,那些变量也是在计算任意子查询的时候当做常量使用的。 又见 Section 9.16。
比如,下面的查询找出每个州中的最大人口数量的城市:
SELECT name, (SELECT max(pop) FROM cities WHERE cities.state = states.name)
FROM states;
4.2.10. 数组构造器
一个数组构造器是一个表达式,它从它的成员元素上构造一个数组值。 一个简单的数组构造器由关键字 ARRAY,一个左方括弧 [, 一个或多个表达式(用逗号分隔)表示数组元素值,以及最后一个右方括弧 ]。 比如
SELECT ARRAY[1,2,3+4];
array
---------
{1,2,7}
(1 row)
数组元素类型是成员表达式的公共类型,使用和 UNION 或 CASE 构造一样的规则决定。 (参阅 Section 10.5)。
多维数组值可以通过嵌套数组构造器的方法来制作。 在内层构造器里,关键字 ARRAY 可以省略。比如,下面的两句生成同样的结果:
SELECT ARRAY[ARRAY[1,2], ARRAY[3,4]];
array
---------------
{{1,2},{3,4}}
(1 row)
SELECT ARRAY[[1,2],[3,4]];
array
---------------
{{1,2},{3,4}}
(1 row)
因为多维数组必须是方形,同层的内层构造器必须生成同维的子数组。
多维数组构造器元素可以是任何生成合适数组的东西,而不仅仅是一个子 ARRAY 构造。 比如:
CREATE TABLE arr(f1 int[], f2 int[]);
INSERT INTO arr VALUES (ARRAY[[1,2],[3,4]], ARRAY[[5,6],[7,8]]);
SELECT ARRAY[f1, f2, '{{9,10},{11,12}}'::int[]] FROM arr;
array
------------------------------------------------
{{{1,2},{3,4}},{{5,6},{7,8}},{{9,10},{11,12}}}
(1 row)
我们也可以从一个子查询的结果中构造一个数组。在这种形式下, 数组构造器是用关键字 ARRAY 后面跟着一个用圆括弧(不是方括弧)包围的子查询。 比如:
SELECT ARRAY(SELECT oid FROM pg_proc WHERE proname LIKE 'bytea%');
?column?
-------------------------------------------------------------
{2011,1954,1948,1952,1951,1244,1950,2005,1949,1953,2006,31}
(1 row)
子查询必须返回一个字段。生成的一维数组将为子查询里每行结果生成一个元素, 元素类型匹配子查询的输出字段。
用 ARRAY 建立的数组值的脚标总是从一开始。 有关数组的更多信息,参阅 Section 8.10。
4.2.11. 行构造
一个行构造器是一个从提供给它的成员字段数值中制作行数值(也叫复合类型值)的表达式。 一个行构造器由关键字 ROW,一个左圆括弧, 零个或者多个用做行字段值的表达式(用逗号分隔),以及最后一个右圆括弧。比如,
SELECT ROW(1,2.5,'this is a test');
如果在列表里有多个表达式,那么关键字 ROW 是可选的。
缺省时,ROW 表达式创建的值是一个匿名的记录类型。如果必要,你可以把它转换成一个命名的复合类型 ― 既可以是一个表的行类型,也可以是一个用 CREATE TYPE AS 创建的复合类型。 可能会需要一个明确的转换以避免歧义。比如:
CREATE TABLE mytable(f1 int, f2 float, f3 text);
CREATE FUNCTION getf1(mytable) RETURNS int AS 'SELECT $1.f1' LANGUAGE SQL;
-- 因为只有一个 getf1() 存在,所以不需要类型转换
SELECT getf1(ROW(1,2.5,'this is a test'));
getf1
------
1
(1 row)
CREATE TYPE myrowtype AS (f1 int, f2 text, f3 numeric);
CREATE FUNCTION getf1(myrowtype) RETURNS int AS 'SELECT $1.f1' LANGUAGE SQL;
-- 现在我们需要类型转换以表明调用哪个函数:
SELECT getf1(ROW(1,2.5,'this is a test'));
ERROR: function getf1(record) is not unique
SELECT getf1(ROW(1,2.5,'this is a test')::mytable);
getf1
-------
1
(1 row)
SELECT getf1(CAST(ROW(11,'this is a test',2.5) AS myrowtype));
getf1
-------
11
(1 row)
行构造器可以用于制作存储在复合类型表字段里面的复合类型值, 或者是传递给一个接受复合类型参数的函数。还有,我们也可以比较两个行数值或者用 IS NULL 或 IS NOT NULL 测试一个行数值,比如
SELECT ROW(1,2.5,'this is a test') = ROW(1, 3, 'not the same');
SELECT ROW(a, b, c) IS NOT NULL FROM table;
更多的细节,请参阅 Section 9.17。 行构造还可以用于连接子查询,这些在 Section 9.16 里面有详细讨论。
4.2.12. 表达式计算规则
子表达式的计算顺序是没有定义的。特别要指出的是, 一个操作符或者函数的输入并不一定是按照从左向右的顺序或者以某种特定的顺序进行计算的。
另外,如果一个表达式的结果可以通过只判断它的一部分就可以得到, 那么其它子表达式就可以完全不计算了。比如,如果我们这么写
SELECT true OR somefunc();
那么 somefunc() 就(可能)根本不会被调用。 如果我们写下面的,也可能会是这样
SELECT somefunc() OR true;
请注意这里和某些编程语言里的从左向右"短路"是不一样的。
因此,拿那些有副作用的函数作为复杂表达式的一部分是不明智的选择。 在 WHERE 和 HAVING 子句里面依赖副作用或者是计算顺序是特别危险的, 因为这些子句都是作为生成一个执行规划的一部分进行了大量的再处理。在这些子句里的布尔表达式(AND/OR/NOT 的组合)可以以布尔代数运算律允许的任意方式进行识别。
如果强制计算顺序非常重要,那么可以使用 CASE 构造(参阅 Section 9.13)。 比如,下面是一种视图避免在 WHERE 子句里被零除的不可信的方法:
SELECT ... WHERE x <> 0 AND y/x > 1.5;
但是下面这样的是安全的:
SELECT ... WHERE CASE WHEN x <> 0 THEN y/x > 1.5 ELSE false END;
用这种风格的 CASE 构造会阻止优化,因此应该只在必要的时候使用。 (在这个特殊的例子里,毫无疑问写成 y > 1.5*x 更好。)
