售前电话
135-3656-7657
售前电话 : 135-3656-7657
本文将会讨论三个部分的内容
1.医疗知识图谱和通用知识图谱的差别
2.医疗知识图谱的两个特征
3.医疗知识图谱的几个具体的应用场景
对知识图谱的预测
hype cycle 2018预言了知识图谱的上升。与此同时,许多企业也开始推出自己的知识图谱服务。从通用的图谱到金融领域反欺诈,各类的图谱如同雨后春笋般地推出。
(2018 关注知识图谱的上升)
但是,的预测,主要面向的是通用知识图谱,而并非是某个领域知识图谱的发展。尤其并不适用于医疗领域知识图谱。
通用知识图谱 vs医疗领域知识图谱
医疗领域的知识图谱( Graph, 下称BMKG)和通用领域知识图谱( Graph,GKB)之间的区别是非常大的。
通用领域知识图谱的主要任务是发现大量不同类型的实体和关系,为各类通用服务提供知识的支持。因为可获取的数据量大,因此各类深度学习方法,可以得以广泛应用。因此可以认为是一类率先成熟的知识图谱。
而生物医疗领域的知识图谱,则是生命领域中,探索相对有限的类型的实体,及其之间的超级复杂的多样化关系。BMKG的每个实体和关系,都是由实验室实验和临床试验的结果中抽取提炼而来。
(基于循证的知识图谱)
相比起通用知识图谱,医疗领域知识图谱更加关注精确率。而这意味着,很多算法识别出来的实体和关系,离实用还有一定的距离。
举例来说,和N2C2是医疗领域两个著名的NLP竞赛,前者侧重于生物领域,后者关注临床领域。从竞赛历史上提交的最佳任务结果来看,基本没有实体和关系识别的F值达到90%以上的case。但是,在临床和医药领域,很多时候对精度的要求超过了99%。
在这里,我们得到了医疗知识图谱的一个额外特征:以循证为基础,对精度有要求。
国内外知识图谱的差异
北大的医疗知识图谱,是国内比较早公布出来的知识图谱。
(:8002)
最近,OMAHA组织出品的HITA中,也包含了一个以“药物-适应症”为主的知识图谱。它对外提供服务,可惜对普通用户并不免费开放。
()
其他的医疗知识图谱,虽然在网络上能找到,却鲜有公布出来可以使用的。
知识图谱并非是一个全新的概念,从更学术的角度来说,它的本质是 Web/ (语义网络)。
NCBI(美国国家生物信息中心)是一个为整个生物医疗领域提供基础数据的机构。它出品的UMLS、MESH和OBA就是语义网络产品。比如,UMLS包含了种135种实体,54种关系,是一个不折不扣的医疗知识图谱。
在《》中,其中有大量的资源是由NCBI或者其下属机构提供的。
(UMLS的部分语义网络关系图)