具有NULL的唯一键

小编典典

具有NULL的唯一键

mysql

这个问题需要一些假设的背景。让我们考虑一个employee有列的表name，date_of_birth，title，salary，使用MySQL作为RDBMS。由于如果给定的某个人的名字和出生日期与另一个人相同，那么根据定义，他们就是同一个人（除非有两个巧合，即我们两个人分别于1809年2月12日出生，他们叫亚伯拉罕·林肯），所以我们将上的唯一键name，date_of_birth这意味着“不要将同一个人存储两次”。现在考虑以下数据：

id name        date_of_birth title          salary
 1 John Smith  1960-10-02    President      500,000
 2 Jane Doe    1982-05-05    Accountant      80,000
 3 Jim Johnson NULL          Office Manager  40,000
 4 Tim Smith   1899-04-11    Janitor         95,000

如果现在尝试运行以下语句，则该语句应该并且将失败：

INSERT INTO employee (name, date_of_birth, title, salary)
VALUES ('Tim Smith', '1899-04-11', 'Janitor', '95,000')

如果我尝试此操作，它将成功：

INSERT INTO employee (name, title, salary)
VALUES ('Jim Johnson', 'Office Manager', '40,000')

现在，我的数据将如下所示：

id name        date_of_birth title          salary
 1 John Smith  1960-10-02    President      500,000
 2 Jane Doe    1982-05-05    Accountant      80,000
 3 Jim Johnson NULL          Office Manager  40,000
 4 Tim Smith   1899-04-11    Janitor         95,000
 5 Jim Johnson NULL          Office Manager  40,000

这不是我想要的，但是我不能说我完全不同意发生的事情。如果说数学集

{'Tim Smith', '1899-04-11'} = {'Tim Smith', '1899-04-11'} <-- TRUE
{'Tim Smith', '1899-04-11'} = {'Jane Doe', '1982-05-05'} <-- FALSE
{'Tim Smith', '1899-04-11'} = {'Jim Johnson', NULL} <-- UNKNOWN
{'Jim Johnson', NULL} = {'Jim Johnson', NULL} <-- UNKNOWN

我的猜测是MySQL说：“由于我不知道NULL出生日期的吉姆·约翰逊不在此表中，因此我将其添加。”

我的问题是：
即使date_of_birth并不总是知道如何防止重复？到目前为止，我想出的最好的办法是移到date_of_birth另一张桌子。但是，这样做的问题是，我最终可能会遇到两个出纳员，他们的名字，头衔和薪水相同，出生日期不同，而且没有重复的方式就无法存储它们。

阅读 396

2020-05-17

共1个答案

小编典典

唯一密钥的 基本属性是它必须是唯一的。使该键成为Nullable的一部分会破坏此属性。

有两种可能的解决方案来解决您的问题：

一种方法（错误的方法）是使用一些魔术日期来表示未知数。这只是使您克服了DBMS的“问题”，但并不能从逻辑上解决问题。预期两个“约翰·史密斯”条目的生日不明的问题。这些家伙是同一个人还是独特的个人？如果您知道它们不同，那么您又回到了同样的旧问题-您的唯一密钥不是唯一的。甚至不要考虑分配一个完整的魔术日期来表示“未知”，这确实是通往地狱的道路。
更好的方法是将EmployeeId属性创建为代理键。这只是您分配给知道唯一的个人的任意标识符。该标识符通常只是一个整数值。然后创建一个Employee表，以将EmployeeId（唯一的，不可为空的键）与您认为是依赖属性的属性相关联，在这种情况下，名称和出生日期（其中任何一个都可以为空）。在以前使用姓名/生日的任何地方使用EmployeeId代理键。这将向您的系统添加一个新表，但是以一种可靠的方式解决了未知值的问题。

2020-05-17