小编典典

如何在MySQL中存储IP

mysql

这星期我们在办公室进行了一场健康的辩论。我们正在创建一个Db来存储代理信息,在大多数情况下,除了应该如何存储IP之外,我们还制定了模式。一个阵营想要使用4个smallint,每个八位位组一个,另一个希望使用1个大int
INET_ATON。

这些表将非常庞大,因此性能至关重要。我处于中间位置,因为我通常在世界中使用MS SQL和4个小整数。我对这种类型的IP存储量没有足够的经验。

我们将使用perl和python脚本访问数据库,以将数据进一步归一化为其他几张表格,以供谈话者,有趣的流量等使用。

我确定社区中有些人所做的事情与我们正在做的事情类似,并且我很想听听他们的经验以及哪种路线最好,IP地址是1大整数还是4小整数。

编辑 -我们关注的问题之一是空间,该数据库将变得庞大,例如每天有5亿条记录。因此,我们试图权衡空间问题和性能问题。

编辑2
有些对话已经转移到我们将要存储的数据量上……这不是我的问题。问题是哪种是存储IP地址的最佳方式,为什么。就像我在评论中所说,我们为一家财富50强的公司工作。我们的日志文件包含来自用户的使用情况数据。反过来,这些数据将在安全上下文中用于驱动某些指标并驱动多个安全工具。


阅读 351

收藏
2020-05-17

共1个答案

小编典典

我建议您查看将要运行的查询类型,以决定采用哪种格式。

仅当您需要提取或比较各个八位位组时,才需要考虑将它们分成单独的字段。

否则,将其存储为4字节整数。这也有让您使用内置的MySQL的奖金INET_ATON()INET_NTOA()功能。

性能与空间

存储:

如果仅支持IPv4地址,则MySQL中的数据类型可以是UNSIGNED INT仅使用4个字节存储空间的数据类型。

要存储单个八位位组,您只需要使用UNSIGNED TINYINT数据类型,而不是SMALLINTS,这将占用每个存储空间1个字节。

两种方法都将使用类似的存储,可能会为单独的字段使用更多的存储空间,从而产生一些开销。

更多信息:

性能:

使用单个字段将产生更好的性能,它是单个比较而不是4。您提到您将只对整个IP地址运行查询,因此不必将八位字节分开。使用INET_*MySQL
的功能将在文本和整数表示之间进行一次转换以进行比较。

2020-05-17