全球最大的生物技术公司之一安进公司致力于分子生物学和生物化学领域的前沿研究。 该公司的目标是提供基于重组DNA技术的医疗保健业务。 Amgen拥有数TB的药物试验数据,因此转向TigerGraph查找该数据中的推论。
升级到TigerGraph之后,Amgen能够更快地加载数据,并在以TB为单位的海量数据集中识别推荐网络、普通患者和最具影响力的提供者。 “拥有50亿个顶点和200亿条边,这是巨大的数据,要在这些数据中找到推论并不容易,但是TigerGraph为我们扩展了规模。” Amgen的数据科学与分析总监Maddileti说。
现在,Amgen的数据科学团队能够通过其对推荐网络和有影响力的医生的见解,为同事提供营销和品牌支持,并确保每个人都充分了解可以积极影响数百万患者护理质量的药物。
Amgen公司的数据涉及医生、患者及其之间的互动以及患者的药物和诊断。 Amgen的数据科学家可获得的信息量达到TB级,因此在数据之间寻找联系非常具有挑战性。 尤其是,Amgen希望创建一个提供者的社交网络,尽管该公司拥有索赔数据和提供者数据,但它却无法知道一位医生将哪个患者转诊给另一位医生。 “我们处理大量的数据,EMRs(电子病历)和CHRs(综合健康记录):根据安进(Amgen)数据科学和分析总监Vishnu Maddileti所说。 “它的大小达到了TB级,而将RDBMS(关系数据库管理系统)中的这些内容组合在一起将是一场噩梦。”
Amgen公司很快看到了使用图数据库和分析来管理其数据的好处,但在使用其初始的图数据库供应商进行扩展时,很快就遇到了问题—— 加载数据需要花费大量时间,一旦加载,计算要么没有完成,要么非常缓慢。而 TigerGraph为Amgen提供了他们想要的速度和规模。
拥有50亿个顶点和200亿条边,这是巨大的数据,要在这些数据中找到推断并不容易,但是TigerGraph为我们扩展了规模。
——Vishnu Maddileti|数据科学与分析总监 | Amgen安进公司
Amgen安进公司致力于通过释放生物学潜力,造福全球患有严重疾病的患者。为了实现这个愿景,安进长期专注于人类创新药物的探索、研发、生产和销售,并通过借助前沿人类遗传学等工具,力求揭示疾病的复杂性,洞察人类生物学的基本机制。
安进聚焦于有巨大医疗需求且远未被满足的疾病领域,利用自身在生物制药方面的先进经验,旨在为提升人类健康水平和生命质量做出杰出贡献。自1980年创立以来,安进现已成为全球领先的独立生物技术公司之一,为全球100多个国家及地区的千百万患者提供创新药物,同时还拥有一批极具潜力的在研药物。
安进中国总部设于上海,业务覆盖全国近80个城市。在中国,安进聚焦心血管疾病、骨健康等亟待满足的慢性疾病领域,为患者提供创新和更优的治疗选择。
Anna Veronika Dorogus
Machine Learning Expert
Anna Veronika Dorogush graduated from Lomonosov Moscow State University and Yandex School of Data Analysis. She used to work at ABBYY, Yandex, Microsoft and Google on Machine Learning infrastructure and Machine Learning frameworks. In 2017 she published the open-source library CatBoost, which is now one of top-3 most popular Gradient Boosting libraries, and the top 7-th most used Machine Learning framework in the world according to Kaggle 2021 review.