论文泛读不定期更新。
SpanBert
Global Pointer: Novel Efficient Span-based Approach for Named Entity Recognition
2022-12-11阅读
论文概况
苏剑林 2022年8月
A Unified MRC Framework for Named Entity Recognition
2022-12-07阅读
论文概况
##笔记
使用MRC(Machine Reading Comprehension)思想,将NER任务转换为MRC任务。它能引入query先验知识,对重叠的NER实体相当于回答不同的问题,所以它能同时解决flat和nested NER问题。
Named Entity Recognition as Dependency Parsing
2022-12-05阅读
论文概况
笔记
以前NER常见模式是BiLSTM+CRF,BiLSTM用于输入编码,CRF用于分类。本文提出一种双仿射模型替代CRF用于分类。
" class="lazyload" data-srcset="" srcset="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==" class="lazyload" data-srcset="" srcset="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==
Boundary Enhanced Neural SpanClassification for Nested Named Entity Recognition
边界增强神经跨度分类用于嵌套命名实体识别
阅读时间:2022-09-19
论文概况
AAAI 2020
阿里巴巴
Chuanqi Tan, Wei Qiu, Mosha Chen, Rui Wang, Fei Huang
问题提出
针对嵌套命名实体识别,基于span的方法有两个问题:
- 对所有子序列进行分类在计算上是十分昂贵的,效率低下。
- 基于span的方法主要侧重于学习跨度表示,但缺乏明确的边界监督。
为此,本文提出一种边界增强的神经跨度分类模型(BENSC),除了对span进行分类之外,本文还结合一个额外的边界检测任务来预测那些作为实体边界的单词。这两个任务在多任务学习框架下联合训练,通过额外的边界监督增强了跨度表示。被视为实体的span应该在span级别和边界级别都具有高概率。另外,边界检测模型具有生成高质量候选span的能力,大大降低了推理过程中的时间复杂度到几乎线性时间。
模型架构
" class="lazyload" data-srcset="" srcset="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==" class="lazyload" data-srcset="" srcset="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==
Chinese named entity recognition: The state of the art
中文命名实体识别:最新技术
阅读时间:2022-08-11
论文概况
2022年2月 Neurocomputing