英文原文地址:https://mitchum.blog/null-values-in-sql-queries/
翻译:高行行
小结:
1. SQL 里的 NULL 和其他编程语言里的 NULL 是完全不同的东西
2. 在SQL中将 NULL 当未知来看
今天的帖子是关于SQL中的NULL值的,由我的朋友和数据库向导Kaley提供。如果你想了解有关 SQL,Oracle 数据库以及使查询运行更快的更多信息,请访问他的网站。
这是一个使很多萌新开发人员陷入困境的话题-SQL查询中的NULL值的概念。
每当你向数据库发出SQL查询时……你想知道一列中是否包含NULL值……写查询将找到结果的正确方法是什么?
你应该使用这样的查询吗?
<code>SELECT * FROM SOME_TABLE
WHERE SOME_COLUMN = NULL/<code>
要么!你应该使用这样的查询吗?
<code>SELECT * FROM SOME_TABLE
WHERE SOME_COLUMN IS NULL/<code>
…答案是,你应该使用第二个查询(SOME_COLUMN IS NULL)。
现在为什么呢?
我们不在数据库中进行其他任何比较时都不要使用“ IS ”关键字,对吗?
如果我们想知道一个字段是否等于一个,我们可以使用如下的WHERE子句:
<code>WHERE SOME_COLUMN = 1/<code>
那么为什么我们在IS关键字上使用 NULL 值呢?为什么我们需要区别对待 NULL ?
答案是这样的:在SQL中,NULL表示“未知”的概念 (因此NULL值表示“未知”值)。
1. Null 为未知
在大多数数据库中,NULL和空字符串(由 "双撇号" 或 '' 表示)之间存在差异。
但是,并非所有数据库都这样:例如,Oracle 数据库不允许你使用空字符串。任何时候Oracle数据库看到一个空字符串,它都会自动将空字符串转换为NULL值。
但是,对于大多数其他数据库,NULL值与空字符串的处理方式不同:
- 空字符串被视为没有值的已知值。
- 将NULL值视为未知值。
这是我问以下问题的区别:“美国总统西奥多·罗斯福的中间名是什么?”
- 一个答案可能是:“嗯,我不知道西奥多·罗斯福的中间名是什么。”(此想法可以由Theodore Roosevelt的记录的MIDDLE_NAME列中的NULL值表示)
- 另一个可能的答案可能是“西奥多·罗斯福总统实际上没有中间名。他的父母从未给他起过中间名,而且我知道西奥多·罗斯福(Theodore Roosevelt)没有中间名。(你可以通过在MIDDLE_NAME列中输入一个空字符串或 '' 来表示)
Oracle 数据库是最显著的例外,其中这两个值实际上都将由NULL表示-除 Oracle 以外的大多数数据库对 NULL 和空字符串的处理方式都非常不同。
只要你记得 NULL 值代表一个未知值,那么这将有助于你制作SQL查询,并帮助你解决使用 NULL 值可能遇到的一些棘手情况。
例如,如果你要使用 WHERE 子句这样的查询:
<code>SELECT * FROM SOME_TABLE
WHERE 1 = 1/<code>
该查询将返回行(假设SOME_TABLE不是空表!),因为表达式“ 1 = 1” 可证明是正确的……它可以被证明是正确的。
如果我要说:
<code>SELECT * FROM SOME_TABLE
WHERE 1 = 0/<code>
…然后数据库将看到此情况,并将“ 1 = 0”评估为false(这意味着该查询将永远不会返回任何行)。
但是如果我要说:
<code>SELECT * FROM SOME_TABLE
WHERE 1 = NULL/<code>
数据库基本上是这样的:“我不知道这两个值(1和我们的黑盒NULL值)是否相等”……因此它不返回任何记录。
2. 三值逻辑
在SQL查询中有WHERE子句时,它可以具有三种不同结果之一:
- 可以是真的(它将返回行)
- 它可以是错误的(并且不会返回行)
- 或者它可以为 NULL 或未知(未知也不会返回值)
你可能会想,“好吧,但是为什么我要关心 false 和 null 之间的区别,因为数据库对这两个值的处理完全相同?”
好吧,让我告诉你哪里可能遇到麻烦:让我们介绍一下 NOT() 条件。
如果你要说:
<code>SELECT * FROM SOME_TABLE
WHERE NOT(1 = 1)/<code>
然后,数据库首先要求值1 = 1,然后说:“好吧,那显然是对的。”
但是随后它将对其应用 NOT() 条件。数据库即将运行,“好吧,当被注释时,它变成了假……所以 NOT() 条件导致我们的WHERE子句在这里是假的。”
因此,上面的查询不会返回任何记录。
但是,如果你要说:
<code>SELECT * FROM SOME_TABLE
WHERE NOT(1 = 0)/<code>
然后,数据库首先计算表达式1 = 0,并说:“那显然是错误的。”
但是然后它将应用 NOT() 条件,这将给我们相反的结果,因此它变为true。
因此此查询将返回记录!
如果我发出以下查询怎么办?
<code>SELECT * FROM SOME_TABLE
WHERE NOT(1 = NULL)/<code>
数据库首先要评估 1 = NULL。(请记住,它将把NULL当作一个未知值!)
它会说:“我不能说1是否等于 NULL,因为我不知道 NULL(未知)值是什么。”
因此,它
不会产生真实的结果,也不会产生错误的结果 –而是会产生NULL(或未知)结果。NULL 结果将由 NOT() 运算符解释。
每当你使用 NULL 并将其置于 NOT() 条件时……结果就是另一个NULL!(未知的反面是……嗯……另一个未知)。
因此,NOT() 运算符对 null 条件不做任何事情。
所以这些查询中的……
<code>SELECT * FROM SOME_TABLE
WHERE NOT(1 = NULL)/<code>
<code>SELECT * FROM SOME_TABLE
WHERE 1 = NULL/<code>
…将不返回任何记录…即使它们是相反的!
3. NULL 和 NOT IN
如果我使用WHERE子句发出这样的查询:
<code>SELECT * FROM SOME_TABLE
WHERE 1 IN (1, 2, 3, 4, NULL)/<code>
…那么显然 WHERE 子句将是正确的,由于1在我们的 IN 列表中,所以该查询将返回记录…
但是如果我要说:
<code>SELECT * FROM SOME_TABLE
WHERE 1 NOT IN (1, 2, 3, 4, NULL)/<code>
那么显然这将是错误的,并且该查询将永远不会返回记录,因为数字1出现在我们的IN列表中,并且我们说“ NOT IN”…
现在,如果我要说这样的话怎么办?
<code>SELECT * FROM SOME_TABLE
WHERE 5 NOT IN (1, 2, 3, 4, NULL)/<code>
此 WHERE 子句将永远不会返回任何记录,因为它不是真正的可证明(它不能被证明是真的)。数字5没有明确出现在“ IN”列表中,但是5可能在我们的“黑盒” NULL值内(数据库不一定知道 NULL 的值是什么)。
这将产生 NULL 结果(表示未知结果),并且此 WHERE 子句永远不会返回任何记录。
这就是为什么将 NULL 值等效为未知值很重要的原因-每当你编写复杂的
SQL查询时,它都会为你提供帮助。希望你现在已经准备好处理SQL查询中的NULL值!
参考文章
神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !
閱讀更多 駭客與畫家 的文章