抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

靖待的技术博客

小清新IT旅程 | 为中华之崛起而读书





  论文泛读不定期更新。


Entity linking meets deep learning: Techniques and solutions

实体链接遇到深度学习:技术和解决方法
阅读时间:2022-08-11

论文概况

2021年 IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
CCF-A
Wei Shen, Yuhan Li, Yinan Liu, Jiawei Han,Fellow, IEEE, Jianyong Wang,Fellow, IEEE, Xiaojie Yuan
PDF

笔记

从三个方面展开:嵌入(Embedding)、特征(Feature)、算法(Algorithm)
Embedding包括字(word)嵌入、Mention嵌入、实体(entity)嵌入、对齐(aligenment)嵌入。
特征包括先验流行度、表面形式相似度、类型相似度、上下文相似度、主题连贯性。
算法包括MLP、基于图的算法、强化学习。
给出了十种广泛使用的实体链接数据集。
未来方向:多源异质文本数据、NER和EL联合、更高级的语言模型、EL模型鲁棒性

Multilingual Autoregressive Entity Linking

多语言自回归实体链接
阅读时间:2022-08-11

论文概况

2022年3月 Transactions of the Association for Computational Linguistics SCI Q1
Nicola De Cao, Ledell Wu, Kashyap Popat, Mikel Artetxe,Naman Goyal, Mikhail Plekhanov, Luke Zettlemoyer,Nicola Cancedda, Sebastian Riedel1,6, Fabio Petroni
Facebook AI
PDF
CODE

笔记

提出mGENRE系统,它是一个用于多语言实体链接问题的序列到序列的系统,用于解析特定语言mention到多语言知识库。对于特定语言的mention,mGENRE以自回归的方式从左到右逐个(left-to-right, token-by-token)标记预测目标实体的名称。自回归公式有效地交叉编码关于字符串和实体名称,用来捕获比标准点积更多的交互。它还可以在大知识库中进行快速搜索,即使对于没出现在mention表中和不用大规模向量索引的mention也是如此。虽然先前的MEL工作对每个实体使用单一表示,但我们匹配尽可能多的多语言的实体名称,这允许利用源输入和目标名称之间的语言连接。此外,在完全没有训练数据的语言的零样本设置中,mGENRE将目标语言视为在预测时被边缘化的潜在变量。这使平均准确度提高了50%以上。
mGENRE

评论