博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《知识图谱》阅读笔记(六)
阅读量:2134 次
发布时间:2019-04-30

本文共 854 字,大约阅读时间需要 2 分钟。

6 关系抽取

不同的关系将独立的实体连接在一起编织成知识图谱。

6.1 任务概述

6.1.1 任务定义

关系定义为两个或多个实体之间的某种联系,关系抽取就是自动识别实体之间的某种语义关系。根据参与实体的多少可以分为二元关系抽取和多元关系抽取,其中二元关系是指两个实体间的关系,多元关系指的是三个及以上实体间的关系。二元关系抽取是其他关系抽取研究的基础。

6.1.2 任务分类

根据处理数据源的不同,关系抽取可以分为以下三种:

(1)面向结构化文本的关系抽取
结构化文本包括表格数据、XML文档以及数据库数据等,这列数据通常具有良好的布局结构,因此抽取比较容易,可针对特定的网站编写特定模板进行抽取,抽取准确率也比较高。
(2)面向非结构化文本的关系抽取
非结构化文本指的就是纯文本。
但是,由于自然语言表达的多样性、灵活性,实体关系在文本总一般找不到明确的标识,这使得从中抽、识别语义 关系非常困难,需要自然语言处理技术的支持。
相对来说,从非结构化文本中抽取关系的准确率比较低。
(3)面向半结构化文本的关系抽取

根据抽文本的范围不同,可以分为:

(1)句子级关系抽取
(2)语料(篇章)级关系抽取

根据所抽取领域划分为:

(1)限定域关系抽取
(2)开放域关系抽取

6.1.3 任务定义

关系定义为两个或多个实体之间的某种联系,关系抽取就是自动识别实体之间的某种语义关系。根据参与实体的多少可以分为二元关系抽取和多元关系抽取,其中二元关系是指两个实体间的关系,多元关系指的是三个及以上实体间的关系。二元关系抽取是其他关系抽取研究的基础。

6.1.4 相关评测

6.2 限定域关系抽取

6.2.1 基于模板的关系抽取方法

6.2.2 基于机器学习的关系抽取方法

6.2.2.1 有监督的关系抽取方法

  1. 基于特征工程的方法
  2. 基于核函数的方法
  3. 基于神经网络的方法

6.2.2.2 弱监督的关系抽取方法

6.3 开放域关系抽取

  1. 语料的自动生成和分类器训练
  2. 大规模关系三元组的抽取
  3. 关系三元组可信度计算

6.4 小结

转载地址:http://adugf.baihongyu.com/

你可能感兴趣的文章
什么是 ROC AUC
查看>>
Bagging 简述
查看>>
详解 Stacking 的 python 实现
查看>>
简述极大似然估计
查看>>
用线性判别分析 LDA 降维
查看>>
用 Doc2Vec 得到文档/段落/句子的向量表达
查看>>
使聊天机器人具有个性
查看>>
使聊天机器人的对话更有营养
查看>>
一个 tflearn 情感分析小例子
查看>>
attention 机制入门
查看>>
手把手用 IntelliJ IDEA 和 SBT 创建 scala 项目
查看>>
双向 LSTM
查看>>
GAN 的 keras 实现
查看>>
AI 在 marketing 上的应用
查看>>
Logistic regression 为什么用 sigmoid ?
查看>>
Logistic Regression 为什么用极大似然函数
查看>>
SVM 的核函数选择和调参
查看>>
LightGBM 如何调参
查看>>
用 TensorFlow.js 在浏览器中训练神经网络
查看>>
cs230 深度学习 Lecture 2 编程作业: Logistic Regression with a Neural Network mindset
查看>>