文章摘要:[目的]通过构建自动化检测模型来有效识别社交媒体中的虚假信息,探讨如何解决人工识别、单特征机器学习等现存方法中,难以兼顾海量数据处理的速度与准确性的问题。 [方法]分类模型是虚假信息监测的主流处理方法,但大多停留在文本语义或浅层情感等层面的特征提取,对于深层次语义特征增强方面的探索较为缺乏。本文以新浪微博社交平台为研究对象,以单一文本特征BFID模型(BERT False-Information-Detection,BFID)作为实验基准模型,提出了两种融合语义增强的虚假信息检测方法。 [结果]以单一文本特征BFID模型的结果为基线,提出的融合情感特征的BFID-SEN(BFID-Sentiment)模型在虚假信息识别的部分准确率上提升约1.6个百分点,而融合图片特征的BFID-IMG(BFID-Image)模型通过结合深度残差网络ResNet(Residual Neural Network, ResNet),在虚假信息识别的部分准确率上稳定提升约0.8个百分点。 [局限]由于融合情感特征的语料数量、情感类别与多模态虚假信息数据集有限,模型训练不充分,因此语义增强的融合效果有限。 [结论]本文提出的两种融合语义增强方法均能在一定程度上更好地识别虚假信息。
文章关键词:
项目基金:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2022/0928/2645.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话: 投稿邮箱: