交通运输部管理干部学院钱哨:交通运输行业舆情监测与预警可行性初探
交通运输部管理干部学院  2014年01月06日

  摘要:交通运输行业点多、面广、服务特色明显,是国计民生关注的重点行业,虽然部分单位和省区交通主管部门建立了相关的舆情监测商业性合作试点,但在具体运营和操作层面比较难以落实。本文通过分析舆情监测的主要机理和特征,根据现有主要的舆情监测技术手段,阐述了交通运输行业舆情监测的必要性和可行性,提出交通运输行业舆情监测的主要技术手段和体系构架,最终得出交通运输行业舆情监测和预警的良性发展思路 

  关键词  舆情监测;语料库;舆情预警
引 言
胡锦涛同志2011年在中共中央政治局集体学习时强调:“要加强网上思想舆论阵地建设,掌握网上舆论主导权,提高网上引导水平,讲求引导艺术,积极运用新技术,加大正面宣传力度,形成积极向上的主流舆论”。交通运输是与人民生活息息相关的服务性行业,一直是网络舆论关注的热点地区,很容易被推到舆论关注的风口浪尖,形成网络舆情热点,甚至推波助澜造成交通运输社会公共事件。李盛霖同志曾在《求是》杂志发表署名文章指出:“交通运输是国民经济的一个重要产业,关乎经济健康发展与社会和谐稳定”。因此,充分认识网络舆论这一崭新的交通运输与社会信息互动交流新形式的重要性;创新发展行业网络文化建设和管理;充分发挥网络优势,实现正面宣传、正确引导网络舆情,对推动现代交通运输业发展具有重要意义。
十八大之后的反腐浪潮来势凶猛,新一届政府密集发声和加速反腐败力度,使得网络舆情进入新的发展阶段,根据人民网调查显示有74.5%的网友愿意选择网络来曝光反腐事件。由于具有体制内外强大的舆论基础,网民与政府的合力巨大,网络舆情力量开始为各级政府所重视。但同时我们也看到网络谣言四起,真假消息鱼龙混杂,网络反腐被利用,变成政治经济力量之间的博弈。
面对当前的新形式和新挑战,交通运输部政法司非常重视行业舆情监测和分析工作,在2013年的“行业新闻宣传工作重点”中指出,加强舆情监测分析和研判,提高舆论引导的及时性、权威性和公信力、影响力,为营造交通运输事业又好又快发展的良好氛围提供舆论支持。基于此,交通行业政府部门要切实转变思想观念,建立完善的监管引导舆论机制,切实提高关键时刻引领舆论主流的能力;坚持预防为主,建立应对网络舆情的预警机制,建设舆情监测与分析系统,对涉及交通行业且可能造成突发舆情的事件及时预警,掌握舆论发展动向,使舆论工具成为交通行业政府部门的正面宣传平台。
一、 网络监控与网络监测之辩
从法理角度讲,实施舆情监控必须具备三个条件:(1)监控的主体必须是有执法权的国家部门;(2)被监控对象有危害社会危害国家的重大嫌疑;(3)监控的程序必须合理合法,不得侵害个人隐私以及正常的商业利益,其目的是维护国家的安全与稳定。因此,从交通运输行业行政管辖范围分析,各级交通运输行业管理部门是没有权利和职责进行网络监控的,但完全可以实现网络舆情监测。
网络舆情监测主要以目前互联网中论坛、微博、新闻信息、视频、传统媒体报道等多个信息发布渠道获取与本部门有关的资讯内容为监测对象,发掘网民关注的热点和焦点问题,倾向性言论和主要观点,并通过有效引导方式,正确干预网络导向性为目标,达到正确化解社会舆论的最终目标。
网络舆情监测步骤分为三个环节,分别是监测、预警和应对。在监测环节,有关人员和系统对网络舆情的内容、走向、价值观等方面进行密切关注,将最新情况及时反映到有关部门;在预警环节,对内容进行判断和归纳,对这些正在形成、有可能产生更大范围影响的舆论进行筛选,为接下来可能发生的网络舆情走向做好各种应对准备;在应对环节,当网络舆情变为现实的网络舆论危机事件后,有关政府部门采取的具体行动,如何化解危机、消除不良影响。这三个环节有机组合,从整体上构成了网络舆情联动应急机制。
二、网络舆情爆发的一般规律
网络舆情的爆发一般分为四个时期,分别是潜伏期、突发期、持续期和解决期。其中潜伏期和突发期时间非常短暂,一般在8-24小时爆发,特别是在潜伏期,一般只有“黄金4小时”原则,人民日报新兴媒体版2011年2月2日社论明确指出:“发布信息、引导舆论的黄金时间是4小时,力争做到速报事实,慎报原因,再报跟进是政府处理突发舆情的基本意识。”,而持续期和解决期相对较长,但影响深远。如图1所示为江西宜黄血拆案中的舆情传播统计图。


  如果以沉默失语面对的媒体事件,在24小时以后网络舆情的感性认识将变成理性思考,局部讨论将变成全国热点,语言形态也将异变,甚至出现一定范围的群众聚集。因此,4小时的研判是网络舆情监测的核心,是有效实现政府舆情管控的核心内容,但仅仅依靠人力从浩如烟海的互联网中搜索有关舆情信息是不可能完成的任务,如何利用信息化手段快速发现舆情并及时应对处理,是摆在各级交通运输管理部门面前的一个重大民生问题。图2为网络舆情时间/事态扩展时序图。


  三、交通运输行业舆情监测与预警分析
交通运输行业点多、面广、服务特色明显,是国计民生关注的重点行业,虽然部分单位和省区交通主管部门建立了相关的舆情监测商业性合作试点,但在以下几个方面比较难以落实:其一,交通运输行业术语特色是目前所有商业类舆情监测的空白点,在实际完成交通行业舆情信息抓取的时候,很难从已有的通用性词库中发掘行业本身语义特色,从而在网络舆情信息抓取时候产生误判和丢失;其二,从行政管辖和专项资金使用层面,很难统一进行舆情监测方面的资金支持;其三,费用高昂。一般舆情监测类网站收费标准是按照关键词数量、检索网站和媒体数量、检索报告具体项目进行收费,一般普通事业单位的收费标准至少从十几万到几十万不等。其四,无法实现全行业舆情信息统一管理和全面分析,舆情资讯多元繁杂,重复性投资和建设现象开始出现。
因此有必要研究交通行业网络舆情的现状,网络舆情监测和预警机制,建立交通运输行业统一管理的舆情监测和预警体系,确保交通运输行业舆情监测可以更好的服务交通,提高新形势下科学应对、分析与预警网络舆情能力,及时准确地掌握社会与行业舆情动态,科学引导网络舆论,优化行业建设与治理环境,提升网络舆情危机的化解能力。使得行业舆情管理工作有统一的抓手,最终达到行业舆情信息管理可管可控的目标。
网络舆情监测与预警实现的主要内容分为三个主要方面:信息采集,信息预处理,舆情信息分析与预警决策。
(一)舆情信息采集
舆情信息采集主要利用元搜索引擎完成互联网中基础信息工作,是网络舆情监测是基础工作。一般采用的主要技术主要包括基于网络蜘蛛(爬虫)技术的网页信息获取技术,网络页面超链接解析技术,网络页面信息文本去噪技术,网络页面信息去重技术。自动搜索目标包括新闻网页、论坛、博客和微博等内容,同时对主要的搜索引擎实施搜索,获取并得到具体网页地址,和其他链接地址内容,进而形成超链接图,完成对全网或者定向网络信息的自动收集和汇总工作。


  (二)舆情信息分析和预处理
形成有序的网页地址链接信息后,就进入到舆情信息分析和预处理阶段,分析和预处理阶段主要完成URL网页地址内容的分析工作,该阶段将获取的页面内容交给分词系统进行预处理,根据关键词的程度捕获具体的敏感词内容。因此,能否体现交通运输行业特色的舆情监测系统的核心问题,就是交通
舆情监测术语语料库与结构库建设问题。
交通术语标准库具有封闭性的特点,其封闭性的特点主要是对开放性而言的,现在的语料库(如人民日报语料库,北京大学语料库等)是能根据大量的文本或语境的总结而动态的更新的,这种动态的更新说明语料库是动态的。但是交通术语语料库不是根据大量的文本总结的,而是由专业人员通过总结和筛选得出的,所以说交通术语语料库对于动态语料库来说是静态封闭的语料库。然而交通舆情文本中出现的非标准库中的词语将成为交通行业特色的舆情文本基础。所以,我们对中文分词和相似度技术方法做进一步的研究,使其符合交通术语的特点,最后应用到具体的交通行业与情监测系统中,达到避免遗漏和误解交通文本中的与交通有关的词语,对交通信息标准化和行业舆情分析有指导意义。
建立交通舆情监测术语语料库与结构库后,最重要的是进行交通行业舆情文本分类关键技术研究,文本分类技术中检索分类聚类算法主要研究业务流程和语料库的支撑作用如下图所示。


  (三)舆情信息预警
以日常监测的数据为基础,跟踪最近监测数据变化,分析预测趋势,构建预警模型,实现预警。按照控制学原理我们将网络舆情分二级预警:开关预警和预测预警。开关预警是一旦采集信息有违反国家法律或敏感的词汇不再计算,直接报警,例如监测范围内有关领导人的负面报道。预测预警为分层结构。首先探测筛选出老百姓关心的、对政府影响较大的、关系百姓利益等敏感信息。第二层考察信息影响的范围、地域、观点的维度、信息在原始网站的位置、以及是否敏感时间点。第三层考察跟贴数量、跟贴变化率、转载率。最终得到警情总指数,超过设定阈值报警。预测第一层是基于分类的。从突发公共事件四大类的各子类中,抽取行业关注度较高的信息:如高速公路收费,交通拥堵等内容。第二层是信息加权后排序,对于时局关注度较高的重大信息予以加权,增加舆情信息评价的先后顺序。


  四、小结
综上所述,交通运输行业舆情监测与预警总体架构设计如图5所示,分为信息采集,信息预处理,舆情信息分析与预警决策三个部分,关键技术点包括行业语义库建设,文本分词和分类技术,以及最后的舆情分析内容等。本文所提出的行业舆情监测的整体构架可以由部统一建设和建立,以服务运营模式向全国交通行业系统进行推广工作。由于其知识体系的自主性,底层数据的行业性,信息运维的行业管理特色,可以解决交通行业本身舆情监测和预警的数据支撑问题,为有关部门舆情管理工作提供操作抓手,可以极大降低交通运输管理机构的舆情咨询成本。

  参考文献
[1]Europe commission Public Opinion [DB/OL].http://ec.europa.eu/public opinion/index en.htm
[2]Elizabeth Hahn Hastings,Philip K. Hastings. Index to International Public Opinion( 1986-1987)[M]. Westport, CT: Greenwood Press.
[3]中科天玑.网络舆情安全相关领域国际上的研发进展[J/OL].
[4]SahamiM. Using Machine Learning to Improve Information Access[D]. Computer Science Department: Stanford University, 1999.
[5]冯颖. 网络舆情敏感话题发现平台的研究[D]. 北京: 北京交通大学, 2009.
[6]姚飞, 戴媛. 基于网络舆情安全的信息挖掘及评估指标体系研究[J]. 情报理论与实践. 2008, 03:31-32.
[7]吴绍忠, 李淑华. 互联网络舆情预警机制研究[J]. 中国人民公安大学学报(自然科学版). 2008, 03:38-42.
[8] 许鑫, 章成志, 李雯静. 国内网络舆情研究的回顾与展望[J]. 情报理论与实践. 2009, 03:115-120.
[9] 吴绍忠, 李淑华. 互联网络舆情预警机制研究[J]. 中国人民公安大学学报(自然科学版). 2008, 03:38-42.



文档附件: