TigerGraph 随身听第9期:图数据库在保险行业营销和反欺诈的应用

原文作者:陈玮,泰康在线副总裁兼首席技术官
互联网保险方兴未艾,数字化接踵而来。保险的交易正在被一步步的数据化。无论是基于数据的自动决策,还是基于数据的人工判断,经过底层数据计算后的决策数据成为了关键。保险公司在存储数据方面,用的最多的是商用或开源的关系型数据库,绝大多数的交易数据都存储在这类数据库中。随着半结构化、非结构化数据的增多,陆续引入了NoSQL数据库来满足合适的应用场景,比如键值数据库,可以帮助我们非常迅速地查询日志文件和缓存数据。但随着今天数据量的逐渐增多,数据间的关系比孤岛似的数据更能展现出独特的价值,而且数据的时效性也在业务中逐渐凸显出来,而这块就和我们的数据计算引擎密切相关。
大家知道,我们最早查询数据,是用数据库的直接查询,而后发展,我们用商业的分析软件进行离线计算。面对大数据时代来临,我们采用Hadoop、Storm等大数据分布式计算引擎。今天,我们多了一项新的技术选择——就是图数据库。

图数据库的这几项技术特征是我们非常关注的。

首先是图数据库的查询性能。我们认为,它的原生图存储和免索引链接,这2个底层核心的技术特性是非常关键的。当然非原生图并非不佳,而是工程上的选择。对于非原生图,我们的学习周期可能相对短一些,但原生图的性能会更佳。两者各有所长,所以我们还要看应用的场景来进行选择。

图计算引擎适合在数据量庞大的数据集中做全局图算法,这是大数据分析技术的另一项选择。所以当我们不用再在一个个数据容器间搬迁,而是直接能用图计算引擎来解决我们的全局图算法时,这是一个非常合适的技术选择。

当然图数据库最重要的特性是它和关系型数据库一样具备ACID的特征,这样可以使我们在使用图数据库中,保持和关系型数据库一致的理解。除了ACID的特征之外,它还有一个非常优异的性能。大家知道,在关系型数据库中,当我们多表做关联时,性能是显著下降的。但是图数据库不限于schema相互影响,它能通过节点、标签和关系的链接快速找到数据之间的关联,从而带出我们的查询结果。

第三,它具有一定的灵活性,可扩展性极强。在图数据库中,关系型数据库的schema限制被弱化了,同时,强化了数据间的联系,所以在图数据库中,节点、标签和属性是它最重要的特征。所以我们认为联系是未来数据应用中在原数据与数据模型之间存在的一种更直接的联系,而这种联系就可通过图数据库优异的查询性能来完成,而不是导入到大数据的分析引擎中。同时,图数据库也兼容嵌入式和服务式两种模式的选择。

泰康在线的图分析应用场景示例

那么泰康在线在日常交易中,其实有一部分的场景是非常适合图数据库的应用。比如在保险交易中的反洗钱、反欺诈、精准营销推荐等。在反欺诈的场景中,小额分散的保单交易和快速自动理赔是互联网保险的典型特征。欺诈团伙在申请保险理赔时,往往会在有限的时间段内集中提交多个交易。为了满足理赔的时效性和良好的客户满意度,我们既要控制理赔速度,又要控制风险。在这样的场景中,需要利用基于源数据和数据间强关联的这种查询来满足实时的需求。而图数据库在社交领域的查询性能是非常优异的,这已经在内部POC中得到了验证,我们也认为图数据库非常适合这样的应用场景。

同时,我们在精准营销推荐中,也得到了应用和尝试。当下的推荐系统对时效性要求非常高,除了用户自身行为所带来的数据推荐之外,我们同时也会在相似的地域、以及符合条件的人群的推荐上进行反馈,我们依然追求速度最快的反馈效果,并将其应用到推荐的场景中。

TigerGraph是我们接触的供应商中优秀的代表,我们需要的供应商不仅是提供一个图数据库产品,更是熟悉行业领域的专家。通过产品+服务的方式,来满足我们的需要。对于图的应用,我们依然在不断探索中,还处于实际应用的初始阶段。但我认为新技术在带动场景的深化应用是值得投入和期待的。我也很期待图数据库在保险行业内广泛应用,满足数字化时代下保险行业的切实需要。

报名最新直播

在看完(或听完)陈玮先生的精彩分享后,相信越多的人参与到图技术的应用探索中,可以越快地加速保险行业数字化。在这里跟大家预告一下,如果您想具体了解更多图技术在反欺诈方面的应用,欢迎点击下方链接,报名我们5月12日周四上午的研讨会。

2022 Graph+AI 全球峰会正式开始报名

现在注册,即可在5月24日-25日,在线参加2022 Graph+AI 全球峰会。一起探讨利用图算法加速分析、AI和机器学习。

相关资源