文章摘要:传统的多标签文本分类算法在挖掘标签的关联信息和提取文本与标签之间的判别信息过程中存在不足,由此提出一种基于标签组合的预训练模型与多粒度融合注意力的多标签文本分类算法。首先通过标签组合的预训练模型训练得到具有标签关联性的文本编码器,继而使用门控融合策略融合预训练语言模型和词向量得到词嵌入表示,再送入预训练编码器中生成基于标签语义的文本表征。最后通过自注意力和多层空洞卷积增强的标签注意力分别得到全局信息和细粒度语义信息,自适应融合后输入到多层感知机进行多标签预测。在特定威胁识别数据集和两个通用多标签文本分类数据集上的实验结果表明,提出的方法在能够有效捕捉标签与文本之间的关联信息,并在F1值,汉明损失和召回率上均取得了明显提升。
文章关键词:
项目基金:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2022/0118/2463.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话: 投稿邮箱: