随身听第24期:【中国移动】电信行业图分析应用解读
作为目前全球网络规模最大、客户数量最多、品牌价值和市值排名位居前列的通讯运营企业,中国移动在利用图技术优化业务运营方面也是走在前列。今天的随身听,我们一起来看看中国移动某省级公司的案例分享。

场景分析1:在线通信实时反欺诈

电信欺诈久已有之,且有日益猖獗之势。传统欺诈检测解决方案主要依赖于对单个业务实体的行为分析,从其行为中发现异常模式。随着信息技术的快速发展,诈骗人员也在不断升级作案手段。比如,据了解,最新的犯罪手段通过利用GOIP设备同时进行多个手机号通话,该设备同时还支持群发短信、远程控制、机卡分离等功能,从而达到隐藏身份、逃避打击的目的。由于此类型作案号码频繁跳转,隐蔽性极高,加之该类案件侦破经验较少,国内单起案件平均侦破周期长达数月之久。基于关系型数据库构建的传统欺诈解决方案在设计上无法解决这一挑战。
在这个场景中,TigerGraph 帮助客户构建了在线通信实时反欺诈系统,包括多个模块,比如黑号识别、模型打分、基于图的特征提取等。
无论是从性能还是结果来看,TigerGraph 均体现出了明显的优势,使得在关系型数据库中无法处理的场景得以实现,比如可以:
  • 全量处理全省每天所有通话数据,在 TigerGraph中生成通话网络图,规模为顶点10亿,边150亿;

  • 每日3亿次更新,峰值时每秒1万条边更新,查询平均响应时间0.5s;
  • 基于 TigerGraph对关系特征的优异计算能力,系统实现了实时(毫秒级)返回118个基于图的特征收集和模型打分结果;
  • 2分钟识别恶意号码并推送到消费者,白号准确率99.99%+,黑号准确率80%+。
除了实时反欺诈外,TigerGraph还作为客户的图数据分析平台,为其提供底层的技术支持,从而在此之上进行更多图应用场景的开发,比如我们接下来分享的个性化视频推荐。

场景分析2:个性化视频推荐

如今网络电视越来越普及,各大电信运营商也在加大布局自己的电视盒子,也就是我们熟悉的网络机顶盒,中国移动在这方面更是走在前沿,因为他们已经在利用图技术优化平台的视频推荐了。
众多周知,推荐能力已作为企业精准化营销的重要工具深入各个行业,是企业服务能力、品牌实力的重要体现,随着媒体资讯信息的不断丰富及用户对个性化、实时推荐的需求不断提升,企业亟需探索新的推荐手段与方法。 如何通过捕捉消费者的实时行为,与以往的观览记录相结合,确保向正确的人推广适合的视频内容呢?
传统的推荐系统采用数据快照执行离线全量统计计算,而这些快照可能来自数天之前。它们不具备当今所需的实时建模和细致剖析能力。在当今需要次秒级响应的激烈竞争中,仅拥有旧推荐系统是不够的。访问者的关注持续时间很短:要马上抓住,否则就会失之交臂。
该中国移动省级公司为了给客户提供更为实时的精准内容推荐,新的解决方案中通过搭建知识图谱,引入TigerGraph图分析技术使挖掘的特征包含用户行为偏好及资讯信息。基于Kakfa Loader获取到用户的实时阅览内容,通过多跳数据分析改进了用户细分和推荐引擎,从而改善了推荐影片的质量。
除了“千人千面”的个性化内容,“实时” 响应也是实现个性化精准推荐的重要标准。
利用图计算系统将数据实时传输到Hadoop系统、传统数据库仓库或者其他外围系统。借助TigerGraph 图计算系统,针对点播数据以及用户关系数据进行实时处理,再通过TigerGraph 图数据库来计算分析千万级用户的点播特征数据与实时数据关联分析。
经测试,目前搭建的流处理架构,利用TigerGraph 图计算实时处理能力,推荐准确率高于80%,模型查询时间小于20ms。
为每一位客户提供更好的内容和服务,不仅仅是提供实时更个性化的推荐,更重要的是避免给客户带来不必要的打扰和时刻守护用户的通讯安全。

场景分析3:一人多号

除了前面提到的欺诈风险,“一人多号”现象在生活中也非常普遍,很多人都会办理两张卡,甚至三张卡,比如一张移动卡,一张联通卡,甚至一张电信卡。也有可能你的亲人办理了一张卡,但是这张卡的使用者其实是你。
那运营商为何要花这么大力气识别出这些一人多号呢?我们可以想象一下,如果无法识别一人多号,那么可能会有潜在的风险,比如电话卡买卖,并用于电信欺诈,甚至,不法分子利用他人信息办理不同的电话卡从事其他违法行为。另一方面,也可能导致错失机会,比如无法更精准地了解特定用户的行为轨迹或者兴趣,无法更好地进行个性化推荐,从而可能导致潜在收入的下降等。
那么,如何利用图技术更好地识别“一人多号”呢?简单来说,我们可以基于筛出的可疑号码,找出该号码一段时间内的位置轨迹,从而找出那些相同时间段内轨迹拟合度最高的号码。
对于“一人多号”这个场景,主要的挑战在于要根据用户一段时间的行为轨迹,比如一个月,基于相似度算法查找出相似的号码。之前该客户用了10倍的硬件资源,都无法得到计算结果,而借助TigerGraph 的超高速的计算效率,仅用一台机器便可完成计算任务。

场景分析4:实名不实人

接下来和大家讨论的场景,是我们生活中处处可见的实名认证相关的问题。实名制相信大家都不陌生,比如在搭乘交通工具、入住酒店、进行大宗交易、银行开户,以及我们今天讨论到的电话卡使用等,都需要验证你是你、你是这个手机号的合法使用者等。虽然实名制推行了很多年,也越来越被大众所接受,但在安防的角度上,仍然存在着管理漏洞。
当前电信网络诈骗持续高发的一大根源,就是因为大量“实名不实人”的银行卡、电话卡被骗子购买后实施诈骗。谨防“实名不实人”,第一时间阻击电信诈骗,也成了很多警方破获新型电信诈骗案的关键。
在这个场景中,为有效发现“实名不实人”的卡号,从源头打击诈骗号码,中国移动该省级公司借助TigerGraph 图计算分析技术,打造了一套专业的系统,包括三个模型,分别是常驻地分析、交往圈分析、同时通话分析模型,这三个模型互为补充,从而可以准确判断号码是办理人在使用,还是办理人的家人在使用,还是转卖给了其他人使用。
比如针对同证件下开通2个及以上号码的用户,会从这三个模型进行分析。如果同时满足以上这三个模型,那么这很可能就是高危用户,就需要立即对相关号码进行关停处置。如果只是满足了一个或两个模型的用户,则需要经人工研判后处置。
借助 TigerGraph 图可视化,可以更轻松地表示复杂通话关系。对于异常号码预警,每天辅助关停异常号码接近上千个,关停号码的复开率只有不到10%,可以看到这套系统对于“实名不实人”的问题起到了很好的辅助作用。

场景分析5:图计算和机器学习结合的创新方式

最后要和大家分享的,就是图计算和机器学习结合的这种创新方式。不管是在线通信实时反欺诈,还是个性化视频推荐、一人多号,还是实名不实人的场景中,都会用到基于图的特征提取。比如在实时反欺诈中,基于全省级的通话数据,TigerGraph 可以毫秒级返回118个基于图的特征收集和模型打分结果,为机器学习生成新的训练数据来检测电话欺诈,从而很好地提高了机器学习模型的精准度。这在其它图数据库中是无法实现的。
比如传统的机器学习主要是基于通话历史进行特征预测,判断出哪些人可能是欺诈者。而在基于深度图关联得到的图特征进行机器学习预测时,对比发现,前面的欺诈者中,有些可能是销售,有些可能是爱搞恶作剧的人。因此,大幅地降低了误判的比例。
更重要的是,这些图特征的收集,即使是面对全省级的通话数据量,TigerGraph 仍然可以做到毫秒级地收集和打分,也就是接近于实时。这意味着,运营商可以及时发现欺诈者,并在欺诈发生前,就告诉消费者 ”对方可能是欺诈者,请提高警惕”,从而避免欺诈损失。
以上,我们主要讨论了中国移动某省级公司利用图技术增强的4个场景,后续,我们也会再分享更多的应用。如果您也有类似的场景,或者其他问题,欢迎联系我们,我们的专家很乐意和您一起探讨。

本周四直播:图数据库在复杂制造业的应用

最后,跟大家预告一下本周四上午10:30 TigerGraph图课堂直播课程,本次直播我们为大家邀请到了点春科技股份有限公司的CTO/副总裁王福强老师,王老师拥有20年制造业软件解决方案的咨询服务经验。专注于数据治理、主数据、制造业数字化转型等相关解决方案的建设与实施。本次直播将围绕“图数据库在制造业的应用”为主题,以某大型制造业配件保障项目作为实际案例解析。同时,来自TigerGraph的解决方案总监李憓松老师将分享 “Graph+AI赋能未来制造业发展”,帮助制造企业灵活应对市场变化。赶紧报名吧。

相关资源