简介
连接未连接的! 将环境、经济、健康、难民、农作物等方面的联合国数据源,清理和加载到一个图中,供任何人使用。
概述
利用图技术的力量,任何人都可以轻松访问联合国数据这一世界上最强大的数据集。
适合所有人的工具
为了使联合国数据更容易获取和分析,我们设想将工具分为两部分:
- 一个由尽可能多的数据集组成的图数据库,我们可以加载、内置在TigerGraph中 —— 世界上最好的图数据库!
- 一个简单的基于 Web 的用户界面,让不了解图或开发的人能够对存储在我们图数据库中的联合国数据进行交互、过滤、下载和执行基本分析。
- 将联合国数据存入图数据库中,将允许经验丰富的用户对数据集执行深度图分析:我们认为相似性分析是图调查的一个关键领域。
世界上最糟糕也是最好的数据
在我们开始构建之前,我们就知道联合国数据将很难处理,但我们并没有意识到这有多难。 每个数据集都有自己的怪癖、挑战和陷阱——从缺失的年份,到奇怪的聚合,到折叠的维度,再到不复存在的国家! 但是经过一番认真的努力,我们终于在 TigerGraph 中完全加载、连接和可用了最惊人的数据集:
- 总顶点: 1,457,406
- 数据年份: 73
- 国家: 259
- 指标类型: 729
- 单个数据点: 1,456,063
- 总边数: 15,441,320
我们的成功超出了我们的想象,这是我们 729 个指标中的一小部分样本:
- 死亡原因
- 农作物产量
- 难民流动
- 犯罪
- 污染
- 旅游
- 儿童肥胖
- 疫苗接种率
- GDP