近日,一篇由印度学者合作的论文“Social Media ...
近日,一篇由印度学者合作的论文“Social Media Profiling for Political Affiliation Detection”(译“面向社交媒体分析的政治倾向检测”)在国际期刊《以人为中心的智能系统(英文)》(Human-Centric Intelligent Systems, HCIN, eISSN: 2667-1336)上公开发表(https://doi.org/10.1007/s44230-024-00078-y)。一句话概要:社交媒体“政治画像”:BERT模型揭示用户政治倾向。研究动机:社交媒体平台使人们能够方便地讨论各类热点事件或对国家政策发表意见,已经成为民主国家民众发声的关键工具,政府机构和政党也可以利用社交媒体分析公众情绪,以调整其制定的政治策略。然而,社交媒体上也存在一些反抗、批评、歧视和排斥等的观点。其中的反政府观点可能会引发社会动荡、破坏政治稳定,甚至导致暴力事件。而错误信息的传播也可能导致民众对政府产生不信任,甚至引发法律纠纷,如诽谤诉讼等。此外,社交媒体上充斥着自动化账户,这类账号一般被用于传播特定政治观点,影响舆论导向。因此,能够准确识别用户的政治倾向,不仅可以帮助研究社交媒体在政治传播中的作用,也能为防范舆论操控、理解公众态度提供数据支持。研究方法与发现:本研究提出一种基于BERT预训练语言模型的政治倾向分析框架(如图1所示),旨在提升社交媒体文本的立场识别效率与准确性。具体地,首先从X平台收集15,000篇英语帖子和11,000个乌尔都语帖子。根据其内容将其政治倾向归类为亲政府,反政府和中立三种。然后,在此数据集上对所提出的模型进行训练,以实现其他推文的标签预测。实验结果表明,BERT模型能够比其他的模型,如CNN,LSTM,KNN,决策树,ANN和SVM等具有更好的预测能力,在英语和乌尔都语的帖子上分别达到69%和94%的预测性能。此外,该项目还制作了用户概况图,以分组类似的概况,这些概况正在共同传播相同的政治意识形态。
▲图1 模型框架图。
▲ 图2 BERT模型英语和乌尔都语帖子上的训练和测试准确率。如图2所示,训练30个epoch后,在英语帖子的政治倾向性检测的准确率为69%,精度为74%,召回率74%,及实现了70%的F测度。在乌尔都语语言数据集上,该模型以较高的准确率,74%的精度,74%的召回率和73%的F1得分。
▲ 图 3 在英语和乌尔都语帖子上的混淆矩阵。图3中列出了模型在英语和乌尔都语帖子中的测试集上的混淆矩阵。结果表明,这些简单模型在帖子中检测和分类政治倾向问题上具有良好的性能。研究贡献:1)本文收集并发布了包含“亲政府”、“反政府”和“中立”三种政治倾向的英语和乌尔都语数据集,为相关研究提供了重要的数据资源;2)基于 BERT 模型的框架可以有效地识别社交媒体用户的政治倾向,为相关研究提供了参考。
(编辑:吴小华)关于期刊
Human-Centric Intelligent Systems(eISSN:2667-1336)是一本国际化的,经过严格同行评审的开放获取期刊,致力于传播 “以人为中心的智能系统” 中所有相关理论和实际应用的最新研究成果,并提供以人为中心的计算与分析领域的前沿理论和算法见解。为了鼓励科研成果的传播,本刊暂不收取文章处理费。期刊主编:西南交通大学李天瑞教授与澳大利亚悉尼科技大学徐贯东教授顾问委员:东京大学教授,日本国家信息研究所所长Masaru Kitsuregawa与伊利诺伊大学芝加哥分校Philip S. Yu教授投稿咨询:HCIN期刊编辑部Tel:17320182488邮箱:hcin@editorialoffice.cn
专业解答各类课程问题,精准匹配名校导师