降低AML调查成本的秘诀:利用TigerGraph实现高效反洗钱调查!

降低AML调查成本的秘诀:利用TigerGraph实现高效反洗钱调查!
“ 反洗钱(AML)是一系列旨在预防和检测洗钱行为的法律、法规和程序。为了遵守政府监管要求,金融机构建立和运营旨在识别潜在洗钱行为的系统,这些系统通常采用硬编码规则。然而,由于金融交易的复杂性和某些行为模式存在多种合法原因,这些系统往往会产生大量的误报警报。”
随着全球交易数量的增长,金融机构面临着以可扩展的方式处理这些警报的挑战,并需要识别犯罪分子为了避免被抓而采取的不断变化的模式。为了应对这一挑战,越来越多的金融机构开始利用图机器学习来帮助筛选大量的警报,以发现可疑活动。

01

认识洗钱

洗钱(Money laundering)是指通过掩盖资金的真实来源,使非法获取的资金看起来合法的过程。洗钱涉及一系列的交易和活动,旨在掩盖非法资金的来源、所有权和去向,使执法机构难以追踪和识别与这些资金相关的非法活动。
洗钱通常包括三个阶段:放置(placement)、分层(layering)和整合(integration)。
  • 放置阶段:在这个阶段,非法资金被引入金融系统。这可以通过将现金存入银行账户、购买房地产或奢侈品,或将资金用于赌博或其他高现金活动来实现。

  • 分层阶段:在这个阶段,进行多次复杂的交易,创建一系列交易和金融活动,以掩盖审计追踪。这可能涉及在不同账户之间转移资金,将现金转换为不同形式的资产,或通过空壳公司或离岸账户进行交易,以使追踪资金的非法来源变得困难。

  • 整合阶段:在最后阶段,洗钱资金被重新引入合法经济。这些资金通过看似合法的企业或投资方式整合回金融系统,使其看起来像是通过合法手段获得的资金。

洗钱模式:分层
洗钱模式:分层

02

反洗钱(AML)调查流程

反洗钱(AML)调查流程从警报处理开始。在传统的AML系统中,会对交易和相关方应用一系列警报规则。如果有可疑活动被标记出来,人工调查员会审查该方是否存在异常行为。若确实存在异常,该方将被提升为案件状态,需要进一步进行人工审查,以确定活动是否可疑,以及是否需要向特定政府机构报告。如果是可疑活动,金融机构将提交一份可疑活动报告(SAR),完成其监管要求。如果金融机构未能报告可疑活动,将面临监管机构的调查和罚款风险。
反洗钱(AML)调查流程
反洗钱(AML)调查流程
金融机构需要努力提高对洗钱行为的检测准确性,以满足监管要求。最有效的方法是改进警报规则,减少误报(将正常交易错误地标记为洗钱行为)和漏报(未能检测到真实的洗钱行为)。在实践中,误报是一个更为严重的问题。不完善的筛查往往会产生过多的警报,而这些额外的警报(误报)会导致人工调查成本的增加。

03

为什么选择图机器学习?

为了在减少误报的同时保持标记可疑活动的比例,许多机构采用机器学习(ML)来对交易进行分类,并优先处理警报。这是因为机器学习能够利用大量的数据特征来找到最佳平衡点,从而优化目标,例如以最小的误报数量捕捉到98%的洗钱活动。传统的机器学习已被证明对此有帮助,但仍存在局限性。
金融机构正在采用图机器学习(Graph Machine Learning)技术来降低误报率,从而降低运营成本,比如降低10%、20%甚至更多。图机器学习之所以能够实现这一目标,是因为它可以分析各方之间的关系。只有当我们分析各方和事件之间的连接时,洗钱活动才会显露出来。在这个过程中,有两种关键的连接类型需要考虑:
  • 个人之间的关联(例如有利益关系的所有权、政治公众人物等)
  • 账户之间的资金流动(例如交易环、马甲账户等)
图机器学习是机器学习的一个子领域,它利用图数据结构来生成传统机器学习模型(如XGBoost)的特征,或者原生图机器学习模型(如图神经网络)。其核心思想是将不同实体之间的关系信息纳入到复杂系统中。金融服务领域是应用这些技术的理想场所,因为金融交易作为核心数据本身就是不同实体(账户和参与方)之间的关系。由于反洗钱工作的核心是确定账户之间的关系是否涉及可疑活动,因此应用图机器学习是非常自然的选择。

04

图机器学习技术

在反洗钱领域,有几种不同的技术可以将图结构纳入机器学习流程中。第一种方法是为现有的机器学习模型(如XGBoost、随机森林等)计算图特征。这些图特征可以是标准的图算法,如PageRank或最短路径,也可以是根据特定银行的数据模型和客户行为量身定制的模式,例如“与目标参与方相隔3度的先前标记的参与方数量,根据交易金额加权”。另一种方法是使用图神经网络,它在机器学习模型中原生地结合了实体之间的关系,无需显式提取特征。
图机器学习的两种方法:左图展示了将图特征与传统机器学习模型结合,而右图表示利用原生图机器学习模型,如图神经网络(GNN)。
TigerGraph作为图特征生成领域的领先者,其可扩展性(支持处理数十TB的图数据)以及原生分布式和大规模并行处理(MPP)架构使其具备卓越的执行速度。此外,TigerGraph对Python和多个机器学习库的支持,使得数据科学家能够轻松地将图特征或图机器学习功能集成到现有的机器学习工作流程中。

05

图特征与传统机器学习

各种图特征可以用于帮助传统机器学习模型在反洗钱和金融犯罪检测等领域发挥作用。在这里,我们将概述三类主要的图算法,可以用于生成图特征:
  • 最短路径:最短路径算法可以回答类似于“利益相关方与过去存在可疑行为方之间的距离有多近?”这样的问题,这可能为后续的机器学习模型提供有用的信息。
最短路径算法示例:确定一方与已知可疑方之间的接近程度
最短路径算法示例:确定一方与已知可疑方之间的接近程度
  • 中心性算法:如PageRank,可以衡量图中一个顶点对其他顶点的影响力,这在机器学习模型中可以作为一个有用的特征,特别是当与已知可疑方过去的相关性结合使用时。

中心性算法示例,其中较大的顶点代表较高的分数。具有更高中心性的顶点在交易流入和流出方面表现出更活跃的行为,这可能是可疑行为的迹象。
  • 社区检测:社区算法,例如弱连通分量(WCC)或Louvain,可用于确定具有共同特征或相互之间有密切交互的顶点组。一旦确定了社区,可以计算社区的大小、社区内的交易数量/金额等特征,并将其传递给机器学习模型。
在图中检测社区的示例,与可疑方位于同一社区的这些实体更有可能是可疑的
在图中检测社区的示例,与可疑方位于同一社区的这些实体更有可能是可疑的

06

图神经网络

图神经网络(Graph Neural Networks,GNN)是一种操作图数据结构的神经网络架构。这些算法不仅考虑了图中顶点的数值属性,还明确地考虑了顶点之间的边。相比将图特征纳入传统机器学习模型,这种方法可以进一步提高准确性。此外,GNN还可以为调查人员提供额外的可解释性,因为模型不仅提供特征重要性,还提供了图中不同顶点之间边的重要性。
图神经网络进行预测的示例
图神经网络进行预测的示例

07

小结

在反洗钱(AML)领域,传统的基于规则的方法正在被图机器学习的变革所取代。由于金融交易量不断增加和误报警报普遍存在,人们更倾向于开始采用创新技术来提高调查效率。图机器学习通过解析金融数据中实体之间的复杂关系,成为解决方案的关键。
通过利用图特征和先进的图神经网络,金融机构不仅可以减少误报警报,还可以提高调查准确性。在这个领域中,TigerGraph凭借其在生成图特征方面的可扩展性和性能成为领导者。在金融机构应对AML的复杂环境时,图机器学习和TigerGraph的能力相结合,可以提供更强大的反洗钱防御,并优化调查资源的分配。
TigerGraph在金融犯罪检测方面提供了很多图分析的演示示例,欢迎点击下方按钮,前往Tigergraph Cloud免费体验。
您也可以点击下方图片,查看O’Reilly出版的《图驱动高级分析与机器学习》,该书以金融犯罪检测等实例为例,介绍了更多图分析和图机器学习的知识。

关于TigerGraph

TigerGraph是领先的图数据库和分析平台提供商。其强大的技术使组织能够利用互联数据进行高级分析和机器学习。TigerGraph有四个主要的价值主张:金融犯罪(揭示隐藏的犯罪网络);连接客户(将客户、产品和服务连接起来,优化个性化和推荐);敏捷运营(跨数据孤岛分析数据,加快跨部门决策);OEM(为合作伙伴的应用程序提供嵌入式TigerGraph引擎)。欢迎点击下方按钮,前往Tigergraph Cloud免费体验。

更多 “新闻”推荐: