背景

2012年5月谷歌推出知识图谱,探索世界有了新的方式。知识图谱强大的事物关联能力使得信息更容易被搜索,换句话说知识图谱更加直观地描述这个世界,我们想要的结果显而易见。与此同时,各大互联网搜索企业纷纷宣布搜索进入图谱时代。 例如搜索画家达芬奇,图谱不仅仅能列出达芬奇的信息,还能展示出与之相关联的人物和时代信息,与之同时代的其他画家也被搜索出来,并不需要在长长的搜索结果中点开链接逐个阅读一遍。

知识图谱除了提升搜索能力,它在其他领域同样可以展示强大威力。2011年基地恐怖组织头目本·拉登被美国军方击毙,他的死知识图谱功不可没。 著名的安全领域数据公司Palatir利用图谱工具分析大量的数据和线索准确预测本拉登的行踪,为军队斩首行动提供了必要条件。从此知识图谱进入各行各业。

众所周知,许多企业经过多年的经营和累积,拥有了大量的行业数据,这里面蕴含的价值却鲜有人挖掘得出来。知识图谱的引入使得数据唤发新的生机,谁能挖掘出价值,谁将在下一轮竞赛中跑到最前列。

知识图谱优势

数据模型

更适合复杂、互联性、 低结构化的数据

信息检索

精确度、完整性、关联度、智能化程度更高,互操作和用户体验更好

分析能力

基于关系和图的分析能力更强

知识图谱的组成

1、行业数据资源
2、图谱引擎
3、可视化分析器
4、人机交互设备

构建知识图谱

1.支持结构化与半结构化数据源

2.采用自然语言(NLP)规则引擎及机器学习提取,人工抽样审核校验的方式

3.主要输出实体、关系、标签和属性

数据源
数据库 文本、语音 图片 视频
手段
NLP 规则引擎 机器学习 人工
知识类型
实体 属性 标签 关系