舆情监测

微媒体环境下高校网络舆情监测数据采集与预处

微媒体时代,各类微媒体及手机客户端APP成为舆情传播的主阵地,信息数据被大规模地生产、分享和应用,但互联网上的海量信息数据存在过滤困难、识别复杂等问题,各高校需要依靠本校计算机相关专业的技术力量或与第三方信息技术公司合作采集监测信息数据。考虑高校在此方面的运作管理成本,过于巨大的比对库存储量是普通高校无法承担的,需要通过分层抽样,突出重点,发挥优势,设计符合高校实际的信息数据采集与预处理的方法。

第一步,信息数据的采集。从传播介质的层面,考虑经济、技术、空间、时间方面的成本,建议将重点放在学生中拥有广泛使用基础的微信、微博、QQ。从信息数据的内容层面,校内问题、危机事件、政治社会问题等不能遗漏。从监测控制范围层面,通过分层抽样,如利用微信机器人,根据学生专业、年级、班级抽样加好友以获取朋友圈数据,根据不同类别的学生群抽样入群以寻找敏感点。以学生热衷关注的微博账号等为“爬虫”的主要目标对象,对相关载体空间内的舆情内容进行爬抓。从采集方式层面,除了采用计算机监测程序自动抓取的数据挖掘技术,人工检索也是必不可少的。电脑程序毕竟具有局限性,只要人才足够灵活,根据实际情况及时调整。除了舆情监管中相对固定的检索关键词,监测人员须主动参与舆情,广泛了解各类话题,设置非固定的检索关键词,而这部分信息的获取可以依靠各高校内的思政队伍、信息员队伍、学生干部队伍,通过与他们的定期交流、整理相关材料、及时研判提取关键词,加强舆情监管的全面性、及时性、有效性。同时,监测人员要具备一定的政治敏锐性及危机嗅觉,在一些重要的时间节点或重大事件前后,要懂得主动设置非固定检索关键词,确保监测的实效性。从监测人员层面,面对纷繁复杂的信息海洋,人工参与的力量难免显得杯水车薪,但舆情监测毕竟是有章可循的,各高校要懂得利用各种校内外资源,组建信息沟通团队,提升人机联动的信息采集效率。

第二步,信息数据的预处理。这一步同样需要计算机和监测人员配合完成,计算机对爬抓到的信息数据进行统计、储存与分类,但其中有相当一部分无用数据,有计算机无法判别的数据,需要监测人员加以分析处理。这需要大量的人工参与,各高校完全可以发挥人力资源优势,选聘懂技术的学生作为“网络公益文明志愿者”,组建一支志愿者队伍,配合专业监测人员对海量数据进行预处理。节选:“微媒体”视域下 浙江省高校网络舆情监测与分析研究温州职业技术学院 杨晶晶