實體屬性關(guān)系抽取
- 針對語料:通用語料
- 抽取關(guān)系:通用實體關(guān)系
- 抽取級別:句子級別
關(guān)系類型(通用文本)
| 關(guān)系 | 例子 | 類型 | |
|---|---|---|---|
| 隸屬關(guān)系 | |||
| 個人 | 和誰結(jié)婚/是誰的媽媽 | per->per | |
| 組織 | 什么的發(fā)言人/**的總統(tǒng)/什么公司的CEO | per->org | |
| 人為 | 擁有/發(fā)明/生產(chǎn)() | per|org ->art | |
| 空間位置關(guān)系 | |||
| 臨近 | 靠近/ | loc->loc | |
| 指向/方向 | 位于某處南部/ | loc->loc | |
| 整體與部分關(guān)系 | |||
| 組織 | 某個部門(a unit of/ a parent of) | org->org | |
| 政治 | 簽署/附加/吞并 獲取 | gpe->gpe(地理政治實體) |

image.png
關(guān)系類型(ACE2003)
角色關(guān)系:將一個人與組織或地緣政治實體聯(lián)系起來
子類型:成員、擁有者、子公司、客戶、公民
整體與部分關(guān)系:
抽取類型
- 任何名詞都可以當(dāng)作候選實體
- 任何動詞都可以當(dāng)作候選關(guān)系
人的屬性
- 性別
- 出生日期
- 出生地
- 工作
產(chǎn)品的屬性
- 描述信息
- 價格
概念的屬性
企業(yè)的屬性
實體屬性抽取方法
- 基于模式和規(guī)則
- 人工構(gòu)造規(guī)則和模式進行匹配
- 優(yōu)點:準(zhǔn)確率比較高
- 缺點:需要人工構(gòu)造,依賴于特定領(lǐng)域,較難擴展和維護
- Bootstrapping方法
- 有監(jiān)督方法
- 無監(jiān)督方法
- 遠程監(jiān)督方法