为何要开发企业级知识图谱?
随着信息技术的发展,人们经历了以网页链接为核心的Web1.0时代和以数据链接为核心的 Web2.0时代。目前 Web技术正朝着 BernersGLee 提出的语义网络演变。语义网数据规模大,数据来源丰富,类型复杂, 传统的数据管理方式受到了一定的制约。知识图谱(Knowledge Graph)的出现,为解决这些问题提供了新的思路。
知识图谱(Knowledge Graph)本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库。图中的结点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,比如说两个实体之间的相似关系。
构建企业风险知识图谱时,通过图谱呈现的上市公司、人、物、组织机构、行业等实体信息以及实体之间的关系信息,可以帮助从业者更加直观地了解和检索相关实体和关系信息,帮助他们进行企业风险预测、关联企业等分析与应用。
尽管大量的知识图谱日益涌现,但面向企业领域的知识图谱还相对匮乏,且大都只覆盖某一方面。如基于部分企业数据集构建了企业法人知识图谱,但其数据量和数据的覆盖面都存在局限性,它们只提供了基本的信息查询功能,没有深入地挖掘企业之间潜在的关系。
基于关系型数据库的传统解决方案可行吗?
一个完整的企业知识图谱的构建过程包括:本体构建、知识获取、知识融合以及知识数据的存储及应用。知识融合以及知识数据的存储及应用这两个阶段的难点在于:涉及到多个数据源的数据进行大量的关联操作,复杂关系的查询对于关系型数据库来说是巨大的挑战。
相对于关系型数据库表关联消耗大量的硬件资源和计算时长,图数据库以“图数据结构”来存储和计算数据,它将实体与实体之间的关系以免索引链接的方式进行组织、索引和存储,这种数据结构在大规模知识图谱上的查询和搜索效率得到了显著提高。图数据库的设计非常灵活,当加入新的属性或数据时,不需要重构网络。此外,图数据库的可视化功能可以为系统前端带来直观的关系展示,更好地提升用户体验。
TigerGraph如何为您打造企业级知识图谱解决方案?
TigerGraph代表了图数据库演进的下一个阶段,它是第一个能够在互联网规模数据上进行实时分析的系统。TigerGraph的原生并行图(NPG)的设计着眼于存储和计算,支持实时图更新并实现内置并行计算。TigerGraph的类SQL图查询语言(GSQL)为大数据的即时浏览和交互式分析提供支持。借助GSQL的表达能力和原生并行图的运行速度,可以进行深度链接分析,揭示以往因其他系统性能问题或表达能力限制而无法获得的数据价值。
在基于知识图谱的大数据解决方案中,TigerGraph的并行处理能力变得至关重要。TigerGraph可以对大量的供应商、产品、用户等信息进行分布式的加载,连接数据孤岛,加载之后又会对数据进行数据压缩。从而保证高效的数据载入以及降低硬件成本的需求。同时,深度的图查询能力使复杂的图分析成为可能。加上TigerGraph对在线服务具有高并发请求的实时应对能力,可以处理大量用户的应用请求。