TigerGraph 随身听第5期:免费开源的增强型图数据科学库,更新至50多种图算法,如何开始?

最近TigerGraph机器学习和人工智能副总裁Victor Lee 博士的最新博客,分享了TigerGraph更新了包含 50 多种算法的增强型图数据科学库。那这一更新有哪些亮点值得关注?对于用户来说有哪些帮助呢?我们一起来了解一下。

首先,什么是图数据科学?

简单来说,它是数据科学的一个分支,是构建和分析图数据的一项技术。它包括数据建模和数据管理,以及数据分析方法,从简单的数据统计查询,到揭示更复杂模式的图算法,再到形成预测模型的机器学习方法。
TigerGraph凭借其实时可扩展的图数据库,成为了图数据管理的领跑者。图算法从一开始就是TigerGraph的核心技术之一。过去,TigerGraph的算法称为 GSQL 图算法库,因为我们的算法是用GSQL写的。我们把最成功的数据库查询语言SQL改编,使其适用于图遍历,加之其对循环、条件语句、变量和参数等程序的支持,然后将其置入可随时存储和调用的命名程序:这就是GSQL。最近,我们在大力普及开箱即用的图数据科学和图机器学习,其重要举措之一即对算法库进行微调。为彰显这一变化,我们将其更名为图数据科学库。

那么新的图数据科学库,新在何处呢?

最明显的变化就是增加了20多种新算法,使其总数达到50多种,比如图嵌入算法、中心性算法、社区算法、相似度算法等。您可以在GitHub上看到我们持续更新的开源算法库。所有这些算法都是开源的,对用户免费开放,这也意味着您可以根据自己的业务逻辑来修改算法。这也是我们最受欢迎的功能之一。您不必受限于默认的功能,可以自行调整参数、过滤和输出格式。您可以在我们的开发者社区或者给我们发邮件提出您宝贵的意见。
另外,特别值得关注的一点是,所有这些图算法都是数据库内运行的,这意味着您分析的是最新数据,无需导出单独的副本,您甚至可以根据算法的结果来自动更新数据库。并且无论您当前的数据集是大是小,它都能相应扩展。因为TigerGraph采用分布式数据库架构,拥有大规模并行处理能力。

未来?

图数据科学库也将持续增长和完善。TigerGraph想为每个用户提供高性能和易用的图数据科学和机器学习,而图数据科学库只是此愿景的一部分。好消息是您现在可以构建数据管道,以TigerGraph为数据源,在PyTigerGraph或REST APIs的帮助下导出数据,在您喜欢的平台上运行GNN,训练模型。为改善性能,我们于近期推出了机器学习工作台,它是一个基于Jupyter的Python开发框架,使数据科学家能够使用关联数据,快速构建强大的深度学习AI模型,从而实现更智能的大规模洞察。
想象一下,有这样一个Jupyter-style的数据科学平台,它包括了模型开发的关键阶段—图数据和图机器学习!只需在TigerGraph中准备您的数据,将其无缝传输至您的训练环境,就能从您的图机器学习模型中择优训练和调整。是不是很棒呢!
感兴趣的朋友可以点击下方的原文链接,查看我们刚刚提到的相关信息,和免费下载、GitHub链接等。

百万美元图技术挑战赛的最新进展

最后和大家更新下百万美元图技术挑战赛的最新进展,这项全球挑战赛,旨在探索利用图技术和机器学习的力量解决现实世界问题的创新方法。目前已经有来全球超过1300支队伍参赛,如果您也想参加,请务必在4月6日前注册,并在4月20日前提交您的参赛作品。15个奖项共100万美金,最高奖项可获得25万美元现金,同时打造您的全球影响力。
这一期随身听就到这里,我们下期见~

该如何开始使用TigerGraph?

如果您想马上开始使用TigerGraph,您可以免费下载我们的软件产品。如果您对我们的产品感兴趣,想观看我们的使用演示,探讨如何解决您的数据问题,您也可以直接联系我们的销售团队作进一步的了解。