文章摘要:事件抽取是信息抽取领域的一个研究热点。在新冠肺炎疫情常态化下,利用事件抽取技术可以筛选出有价值的信息。然而事件抽取领域缺乏精标注的新冠新闻训练数据集,且因部分事件的复杂性,论元不只存在于一句话中,需要多个句子才能完整描述一个事件。因此,本文首先构建新冠肺炎新闻数据集,接着提出一种三阶段的管道方法实现从篇章中抽取新冠肺炎事件。该方法首先对数据集进行事件类型分类;然后进行事件句的抽取;最后实现篇章级论元抽取。实验结果表明提出的方法能够减少事件分类时间,抽取两个事件句的条件下,对数据通报类论元识别效果最好,在SEE上的准确率能达到67.0%,召回率达到71.0%,F1值达到69.0%;在DEE上的准确率能达到75.0%,召回率达到73.0%,F1值达到74.0%,证明方法能有效抽取新冠肺炎相关篇章级事件。
文章关键词:
项目基金:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2021/1116/2327.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话: 投稿邮箱: