Presidio - 数据保护和匿名化 API


MIT
跨平台
Python

软件简介

Presidio,文本和图像的上下文感知、可插入和可定制的数据保护和 PII 数据匿名化服务。

Presidio
有助于确保敏感信息得到适当的管理,它提供快速分析和匿名敏感文本信息,如信用卡号码、姓名、地点、社会安全号码、比特币钱包、美国电话号码和金融数据。Presidio
使用预定义或自定义识别器分析文本,以识别具有相关上下文的实体、模式、格式和校验和。Presidio 平衡 docker 和 Kubernetes
在规模上的工作负荷。

特性:

  • 非结构化文本匿名化:Presidio 自动检测非结构化文本中的个人可识别信息(PII),基于一个或多个匿名机制对其进行匿名化,并返回没有个人可识别数据的字符串。

对于每个 PII 实体,Presidio 返回一个分数:

  • 图像中的文本匿名化:Presidio 使用 OCR 检测图像中的文本,它还允许从原始图像中编辑文本