0
%
营销人员受坏数据影响
0
%
营销预算被浪费
0
实体解析为何如此重要的9个理由
企业为何要统一ID?
企业收集的数据正在不断增加,但仍可能给出对现实世界的误导或零散的视图。 例如,由于错别字、姓名更改、不同系统的汇总等原因,一个人可能在同一数据库中出现多次或拥有多个数字实体。 如果我们尝试合并两个数据库,当ID系统可能不同或包含错误时,我们如何匹配实体?
统一ID有助于弄清事实,使数据库中真实实体的歧义消除,是必不可少的数据质量工具。
统一ID有助于弄清事实,使数据库中真实实体的歧义消除,是必不可少的数据质量工具。
基于关系型数据库的传统解决方案可行吗?
传统的主数据管理系统是建立在关系数据库上的,关系数据库将诸如客户、联系方式、潜在客户、活动和商机等信息存储在单独的表中,每种类型的业务实体对应一个表。分析师们往往需要连接许多大型表来运行查询,并收集数据,然后进行分析。对于传统的基于关系型数据库的系统,这种查询可能需要数小时甚至数天的时间才能完成。
图分析为统一ID问题提供了一种有效的方法。 TigerGraph图分析平台,具有大量并行计算功能,可以实现毫秒/亚秒级的实时深度分析,是实现统一ID的最佳工具。
图分析为统一ID问题提供了一种有效的方法。 TigerGraph图分析平台,具有大量并行计算功能,可以实现毫秒/亚秒级的实时深度分析,是实现统一ID的最佳工具。
TigerGraph如何为企业打造统一ID系统?
基于TigerGraph图分析的统一ID
合并多个数据源的客户数据并非易事。其中统一ID是一个巨大挑战,统一ID用于确定何时不同数据源的多个实体实际代表的是同一个真实实体,然后将它们合并到一个实体中。
比如以下示例,其中存在三个包含以下类型的客户信息的数据源:
- 来源1(SSN,电子邮件,地址)
- 来源2(SSN,电话,姓名,年龄)
- 来源3(电子邮件,电话,性别)
假设SSN,电子邮件和电话都足以唯一地识别一个人(也就是说,它们构成了个人身份信息,即个人识别信息PII)。问题在于不同的源使用不同的标识符,并且各个记录可能缺少某些信息。随着时间的流逝,丢失的客户PII可能会稍后在另一个数据源中显示。
我们的目标是希望使用我们拥有的有关客户的任何PII来查找所有数据源中客户的所有信息(属性),并建立具有以下属性的统一记录:客户(SSN,电子邮件,电话,姓名,年龄,性别,地址)。
TigerGraph图分析是专门为跨多个源连接以创建单个记录而构建的。在这种情况下,TigerGraph为每个客户创建一个客户顶点,并连接到各种PII顶点,例如SSN、电子邮件、电话。接下来,将具有相同SSN、电子邮件和电话号码的多个客户实体或顶点与应用的业务规则合并,以协调字段或属性的不同值。
免费下载实体解析/统一ID解决方案
使用TigerGraph统一ID,解决数据歧义
统一ID(实体解析,ER) 有助于了解真相,是消除数据库中真实实体歧义的一种基本数据质量工具。
图分析为统一ID问题提供了一种有效的方法。具有海量并行计算能力的原生图数据库是实现该方法的最佳工具。