医患冲突的微博舆情议题建构、地域化差异分析及情绪监测模型的建立
导读:用户在进行网络空间参与热点事件讨论时会因自身所处环境而具有不同的立场,网络舆情和议题导向由此会在网络空间中呈现出地域分化特征。本文以舆情事件“仁济医院赵晓菁事件”为例,分析相关微博舆情的议题导向和情绪传导在网络空间的地域性差异以及与现实社会环境条件的联系。
由中国新闻史学会计算传播学研究委员会与微热点大数据研究院联合举办的第二届传播数据挖掘竞赛已圆满落幕,15支战队尽显风采;以下为“基于新媒体传播数据的地域舆论环境感知”选题优秀作品《医患冲突的微博舆情议题建构、地域化差异分析及情绪监测模型的建立》,由来自汕头大学“开心开心幸福冲冲冲队”精彩呈现。
研究发现,关于此事件舆论主要分化为五类议题并呈现出地域间的倾向差异;本文以“关联度”和“积极性”评价地区的子议题议程设置倾向,发现网络空间中的舆论倾向与经济、医疗等现实社会因素相关性不足但具有一定的特征,根据地域舆论积极性变化过程可以提取舆论预警指数模型。
关键词:医患关系;网络舆论;地域特征;情绪指数模型;舆论预警。
一、绪论
1. 研究背景及意义
1)研究背景
4月24日上海三甲医院仁济医院的胸外科的赵晓菁主任,当天正在出专家门诊,在接诊过程中,由于患者插队而与患者产生摩擦;警察赶到后,医生与警方发生口角,最终警方升级为强制传唤,赵晓菁主任被派出所民警带走问话。
这一事件在网络平台上引发了大量用户以“医患关系”为核心的热烈讨论,由于群体极化效应,在“患者插队”的传言未被官方证实之前,热搜“手铐带走拒绝患者插队的医生”引发公众情绪,产生对警方的不满;但本文认为舆论最终焦点仍是反映社会当前的重要问题——医患矛盾这一症结上。
为了研究关于医患冲突事件,网民们的舆论是否存在地域差异性的参与特征和情绪倾向,以及网民会否因为所处的环境的经济水平、医疗水平等现实生活方面的差异而在网络舆论参与中产生的不同的话题倾向,展开讨论和研究。
2)研究意义
我国近几年正处于医疗改革的关键时期,各种医疗事故和医患纠纷频现,不仅在一定程度上引发舆论对于医疗保健行业的不满,也体现了当前社会的供需矛盾所在。
在此背景下,《国家突发公共事件总体应急预案》新增了“医疗事故和医患纠纷” 的分类足以体现目前医患纠纷形势严峻程度;此外,网络媒体的信息发布、网民的持续关注和讨论,使现实中的突发公共事件在网络上被强烈的曝光,并形成扩散态势和井喷效应;若不加研究和管控,将对社会的和谐稳定起到了严重的破坏作用。
情绪监测模型的建立旨在通过勾画用户特征画像和实时监测情绪,评估相似医患事件,进行舆情模拟和预警,为应对与缓和医患冲突,从民声民意中整体评价目前医疗体系的利弊,构建和谐的医患关系与社会秩序和建设 “健康中国”提供参考和建议。
2. 研究内容
本文借助微热点大数据研究院提供的关于本次冲突事件的微博舆论数据集,使用数据挖掘和分析方法,对不同议题的舆论情绪进行地域化差异分析;并结合经济水平、医疗水平有地区差异的各省数据,探究舆论情绪指数是否与经济、医疗评分有相关性;以及在此前研究基础上建立舆论情绪监测模型。
以“仁济医院赵晓菁”事件为例,在梳理事件脉络的基础上,本文对 2019年 4月 24 日至 2019 年 5 月 8 日时间段内,对数据集中微博平台上相关话题的微博内容、评论内容、用户信息等数据集进行清洗和初步分析;进而采用关联度分析法和模糊综合评价法,归纳出五大舆情议题:医疗体制、医疗资源、医院管理、患者素质、医生服务态度。
运用模糊综合评价法和文本分析技术,对医患冲突的网络舆情进行情绪倾向性分析;利用主成分分析法确定议题权向量后建立舆论情绪监测模型。
3. 研究方法
本文主要采用定性和定量的分析方法:包括内容分析法、关联度分析法、模糊综合评判法、PCA主成分分析法。
除了对原始数据集的处理和挖掘基础上,引入了源自国家统计局网站和国家卫健委《2018年我国卫生健康事业发展统计公报》的外部数据,根据各省经济、医疗等社会状况统计数据对各省经济、医疗的多项指标进行评分。
对比各省舆论情绪倾向和参与度的加权结果,通过SPSS进行相关性分析,以此探究地域舆论议程设置状况差异及其与实际现实经济和医疗水平相关性。
对事件舆情热度、情绪进行量化评价、分析,利用降维的思想、主成分分析方法,确定5个关于医患事件的核心舆论议题的评价矩阵和权向量,建立合理的评价模型。
根据模型公式及其数学性质,给出模型的适用范围;为了进一步研究医患冲突事件的风险管控,本研究还参考了等级全息建模(Hierarchical Holographic Modeling)的风险识别方法,以研究公共危机事件网络舆情风险管理。
二、大数据挖掘在研究中的应用
本文以微热点大数据研究院提供的微博原始数据为对象,借助中科院提供的情绪词库和中文停词表,对评论文本的中心词、词频统计的结果进行评分、加权运算、标准化处理;通过构建中心词评分矩阵、关联度评价矩阵、主观评价模糊矩阵等方式,利用Python语言分析工具进行舆论情绪评分;此外,本研究调用python-sklearn机器学习模型工具对五个议题进行主成分分析,以发现在舆论中五大议题的情绪影响力高低。
1. 数据预处理
数据预处理:在人工筛选后再对数据集进行机器清洗。
本文使用Python-pandas、Numpy、re等对数据的基本信息进行统计、了解,包括:数据规格、标签、数据索引等;对数据中的认证类型、性别、地域进行分类,删除了所有带不明信息的数据,最终获得约351000条有效数据,并对数据的基本情况进行了描述性统计和可视化;由于部分地区数据较少以及研究对象的限制,本文的研究对象将排除港澳台等省市地区。
数据分析:本文主要依据《模糊数学》中的模糊综合评价法及其相应的数学思想,结合传播学中相关的理论进行数据分析;秉承“人工智能”四字,保留机器学习人的思想,并努力地融入人学习机器的新思维,极力追求机器与人的良好配合。
2. 数据处理
对数据集中的文字文本、地域进行提取,调用Python-wordcloud绘制词云图;随机抽取样本评论文本,通过人工阅读检查,配合关于本事件的官方报道,把脉舆情的基本方向。
依此,本文确定了五个关于医患问题的研究方向:政府因素、医疗体制、医疗资源、患者素质、医生服务态度。
① 事件关键词矩阵的生成
A、调用Python-jieba、中科院汉语语言处理包Python-nlpir、 Python-collections、numpy等工具对数据进行处理,得到“事件关键词矩阵”;再建立关联度评价矩阵及其截矩阵,对中心词、词频统计得结果进行人工选择、标准化处理、加权运算得到“评论关联度矩阵”,进而求得“评论关联度矩阵”的截矩阵,用以衡量评论与“医患问题”的关联性。
调用基于机器学习的文本情感分析工具Python-snownlp,对评论文本情感进行分析,得到各评论文本得情绪得分PM(Point of emotional)。
本文利用Python-pandas等工具,把⑤相关性数据和情感得分数据追加到每一条评论的末尾,形成新的数据集,而后再按地区对整个数据集进行切片。
② 建立各地区在各议题上的舆论情绪指数Hn,m的数学模型
首先,计算各地区中CRVβ>0的评论的情绪得分PM的平均值。
其中a为满足条件PM的项数,n为地区代号。
为了研究不同省份在不同议题上舆论的情绪,建立各地区在各议题上的舆论情绪指数Hn,m数学模型:
其中n为地区代号,m为议题代号。
③ 相关性的分析
本文从国家统计局获取了全国各省份经济总量、地区经济质量、地区人均医疗卫生资源、地区医疗卫生资源总量的相关数据,并与Hn,m作Pearson系数相关性分析。
本文数据处理指标概况
三、我国现阶段不同地域的医疗、经济水平及相关性分析
1. 我国各省医疗水平
医疗完善资源是指在一定社会经济条件下提供医疗服务的生产要素的总称,包括医务人员,医疗机构和医疗床位等资源和信息,其多寡也是衡量国家综合国力的一个重要指标。
自新中国成立以来70年,我国在公共卫生领域获得了骄人的成就,平均预期寿命从不到35岁(1949年)上升到77.0岁(2018年),直接反映的是我国卫生医疗水平持续增长;然而,我国是人口大国,幅员辽阔,医疗资源在时空上的分布不均一直是不可忽视的现实矛盾;而无论是在总量上还是在人均上,我国的的医疗卫生资源与其他发达国家相比仍有较大的差异。
从一般印象来说,我国医疗卫生资源的空间分布呈现“东部总量高人均低,西部总量低人均高”的特点,但是为了更加详细客观地表现我国医疗卫生资源分布的现状,本文将通过建立省级医疗卫生资源标准化指标,对各省的医疗资源进行量化评分。
本文采用全国31个省级区域(包括27个省和4个直辖市,港澳台地区数据暂时缺失)的医疗卫生资源数据,数据来源于国家统计局网站2018年的卫生状况统计资料和国家卫健委《2018年我国卫生健康事业发展统计公报》。
针对各省的医疗资源的量化评分,本文选取了每万人拥有卫生技术人员数(人)、每万人拥有卫生人员数(人)、每万人拥有卫生机构床位数(张)、每万人拥有卫生机构数(个)和人均医疗卫生机构诊疗次数(次)这5个参数加权平均后建立各省份人均医疗资源量化得分;选取地方财政医疗卫生支出(亿元)、卫生人员数(万人)、卫生机构床位数(万张)、医疗卫生机构数(个)和医疗卫生机构诊疗人次(亿次)这5个参数加权平均后建立各省份医疗资源总量量化得分。
由于各参数之间存在量纲上的巨大差异,本文对数据同样进行了标准化处理,以此消除量纲差异带来的不变。
标准化的计算公式如下:
其中Yn为第m省份的医疗(人均/总量)量化得分,Ymi为第m省份的第i项参数,max(Yi)和min(Yi)分别是第i项参数的最大值和最小值。
对得出的数据进行可视化处理后得出各地区人均医疗资源分布图和各地区医疗资源总量分布图。
如图1.1和图1.2所示:
图1.1 各省份人均医疗资源分布
图1.2 各省份医疗资源总量分布
由图1.1、图1.2和数据显示,我国整体人均医疗资源分布不均的问题较为严重,其中全国范围内,北京市和浙江省的人均水平明显高于其他省市;而各省份的医疗资源总量分布于与当地人口总量密切相关,医疗资源总量大省同时也是人口大省。
一方面优质医疗卫生资源集中某个地区,导致大量外地人口异地看病就医,对医疗资源进行挤压;另一方面,由于医疗管理体系的不完善,医疗资源紧张与资源浪费现象并存。
这种普遍存在的医疗资源紧张间接反映出医患关系紧张,医生和患者在医疗资源的分配和使用上发生摩擦的风险也随之上升;与此同时,即使地方财政的医疗投入与当地的经济发展水平和常住人口成正相关,但在全国总体医疗资源水平较低等背景下,医疗资源和人口总量不成比例;即使该地医疗资源总量再多,分摊到个人层面不过是杯水车薪;与其说医患矛盾是医生和患者之间的矛盾,不如说是有限的医疗资源和近乎无限的医疗需求之间的矛盾。
2. 我国各省经济发展水平
经济发展水平也是衡量一个国家或地区综合实力的一个重要指标,反映了社会经济现象在不同时期的规模或水平。
我国作为世界第二大经济体,自改革开放以来一直保持经济的中高速增长,更是在2019年人均GDP突破一万美元;不过由于人口基数庞大,各地区经济发展不均衡等因素,我国仍然属于中等收入的发展中国家。虽然经济发展水平属于宏观概念,但是隐藏在其背后的众多因素切实影响着社会生活的方方面面。
互联网和移动终端的普及、教育和医疗水平的提高,这一系列指标的提升,无疑与我国经济发展水平不断提高有显著关系;更重要的是——个人在互联网上对某事件的看法,有可能因其受教育水平或经济水平的影响,而在情感或观点上表现出区域差异;为了更加详细客观地表现我国经济发展现状分布的现状,本文将通过建立省级经济发展水平指标,对各省的经济水平进行量化评分。
本文采用全国31个省级区域(包括27个省和4个直辖市,港澳台地区数据暂时缺失)的经济状况数据,数据来源于国家统计局网站2018年的经济状况统计资料;针对各省的经济状况的量化评分,本文选取了人均GDP(万元),人均可支配收入(万元)和地方财政医疗卫生支出(亿元)这三个参数,进行加权平均后建立各省份各省经济发展现状量化得分;由于各参数之间存在量纲上的巨大差异,本文对数据进行了标准化处理,以此消除量纲差异带来的不变。
标准化的计算公式如下:
其中Pn为第n省份的量化得分,Xni为第n省份的第i项参数,max(Xi)和min(Xi)分别是第i项参数的最大值和最小值。对得出的数据进行可视化处理后得出各省份经济发展现状分布图。
如图1.3所示:
图1.3 各省份经济发展现状分布
由图1.3和数据显示,我国经济发展水平相对较高的区域集中在东部沿海地区,如北京、上海、江苏和浙江等地。
从整体上看,虽然我国各省经济发展迅速,但人均可支配收入在不同地区间存在较大差距;而区域人均收入的差异,也会导致人口的大量迁移,使得部分相对落后的省市发展缓慢,间接导致医疗资源分配的不合理,可能会影响在舆论场上关于医患矛盾的观点和看法。
另外,地方财政医疗卫生支出其实与当地经济发展水平成正相关,较发达地区的医疗财政投入和支出更多,医疗资源的补足更倾向于发达地区,这就导致医疗资源分配矛盾更加突出,助长医患之间的紧张情绪。
3. 舆论情绪评分与医疗、经济水平的相关性分析
提取各地域五类舆论情绪评分及经济医疗评分数据,运用SPSS分析工具对数据进行Pearson系数相关性分析。
结果表明,关联度加权后的情绪数据在与医疗、经济的相关性较弱且显著性不足,因此接受零假设,医疗与经济因素与舆论倾向得分间不具有显著相关性。
但另外值得注意的是,关联度加权后的医疗体制、医院管理、医疗资源、患者素质、服务态度五方面舆情的评分之间存在着显著相关性,说明舆论倾向评分存在着内部一致性,证明评分指标具有较高的信度。
相关性分析结果表明,各地区舆论倾向指标评分与医疗经济水平的评分之间不具有相关性,说明医疗与经济水平可能对于网络舆论导向的没有显著影响;结合湖南师范大学燕道成、陈思妤的《媒介融合背景下的舆论引导:特点、挑战与策略》一文研究,本文发现,网络空间中的舆论可能因为去中心化和全群化等因素而形成“失焦”,舆论的发表于现实生活背景会产生一定程度的分离,网络环境中的舆论导向的主要力量更多来自于媒体和舆论领袖。
本文分析认为原本假设对于网络舆论的导向因素的考量不足,网络空间中的舆论差异不仅来自于用户的现实生活体验,还可能来自于网络舆论领袖、媒体框架、拟态环境等网络大众传播因素;另外,本文研究所纳入的现实社会与地区的分异因素还能够继续扩展,诸如教育、治安等现实社会因素都可能对于用户网络舆论倾向产生一定的影响。
四、医患关系舆情数据呈现与分析
我国是一个人口大国,对于医疗资源的供给还处于不平均、不完善的阶段;看病难、看病贵,是我国长期存在的一个民生问题。
当前,我国正处于医疗体制改革的关键时期,突发的医患冲突事件在全社会中收到广泛关注;而各种医疗事故和医患纠纷频现,不仅体现了当前社会的供需矛盾所在,更在一定程度上引发舆论对于医疗保健行业的不满;若不加研究和管控,将对舆论空间的和谐稳定起到了严重的破坏作用。
1. “仁济医院赵晓箐事件”网络舆情的总体特征
2019年4月25日,一则“上海仁济医院医生赵晓菁因拒绝接诊插队病人,被警方戴上手铐带走问话”的消息,引爆舆论。
26日,当地警方通报称,网传患者陈某无理插队与事实不符,且医患双方确实发生冲突,警方口头传唤赵晓菁配合调查,在赵某拒不配合,并与处置民警发生肢体冲突的情况下,现场使用手铐强制传唤,符合法律规定。
27日,医警双方接受采访时均称,处理上有提升空间,风波本可以避免。
从信息走势来看,微博是该事件的主要传播平台,相关事件的全网信息量达到33.0万条;该事件的爆发时间点为4月25日,在26日引发舆论的关注;同日,@警民直通车-浦东对事件进行警方通报,使信息量于27日达到最高峰;随后,舆论对该事件的关注度逐渐下降。
而从该事件的微博关注者的画像来看,事发地上海、江苏两地的信息数最为显著,此外,广东、北京、浙江、山东、四川等地的网民对此较为关注,发布了相对较多的信息;在用户认证等级中,橙v和蓝v各占比32.96%和3.23%;而在性别上,男女用户数量相当,没有较大性别差异。
下面将对医患冲突事件的每个议题(包括医疗体制、医院管理、患者素质、医疗资源和医生服务态度)进行进一步的分析,从细分议题的角度进行挖掘,以期总结出本次医患冲突事件的舆情倾向特性。
2. “仁济医院赵晓箐事件”网络舆情的分议题情绪特征与分析
本文对五个议题的情绪得分进行主成分分析,研究在舆论中五大议题的情绪影响力高低。
结果显示,医疗体制、医院管理、患者素质、医疗资源和医生服务态度分别占比53.36%、18.36%、11.27%、6.82%和6.07%;其中“医疗体制”议题对情绪评分的影响力占比最大,而“医生服务态度”议题的影响力占比最小。
此外,由“五大议题情绪表征地域差异图”可知,在各个分议题的情绪分布上出现明显的地区差异,各地区网友对“患者素质”有着最高的消极情绪,而对“医疗体制”的舆论情绪消极度最低。
广东、四川、江苏等在全部议题的舆论情绪中呈相对消极,这类省份普遍有较大的网民基数,拥有较大的讨论丰度和烈度;而黑龙江、江西、宁夏等在全部议题的舆论情绪中呈相对积极,这可能与讨论数量较小,情绪表征受个别评论影响较大有关。
1)医疗体制议题的舆情情绪特点
在主成分分析中,“医疗体制”是最影响舆论情绪的议题。而对该议题的舆论内容分析可知;浅层上,舆论主要涉及对加号机制的运行方式和合理性的否定,也有对专家号稀缺和长时间等待表示与涉事患者“感同身受”;而在深层上,冲突事件直指医疗体系的不完善,表现出医院管理、诊疗制度等方面存在问题,无法有效保障就诊秩序。
与此同时,医疗体系资源分配不均,优质医护人员在地区上有质量和数量的倾斜,也解释了医疗体制如何最大程度地影响着舆论情绪;此外,建立建全快速的申诉、处理和援助渠道,也是网民对医改的主要诉求之一。
此外,也有网民从医生角度发声,认为“保护医生”应从药品改革开始,完善医疗保险,减轻患者负担,消除过往部分医收受私利的刻板印象,避免成为医患冲突事件中“替罪羊”、“受气包”的角色;同时医疗体制改革也应关注医生群体福利、社会地位、职业压力,不少网民提到基层医院的医生处于“体制内的弱势”,压力大、地位低。
相比其他议题,医疗体制并没有非常显著的地区差异,表明是一个举国聚焦,全民关注的问题。
2)医院管理议题的舆情情绪特点
“医院管理”议题也是舆论讨论的重点,本次医患纠纷发生在仁济医院医院门诊,作为医患接触的一线,门诊是最容易发生矛盾与冲突的地方,医院更应加强对门诊的安保与管理工作。
在本事件中,有舆论认为赵晓菁医生为维护就诊秩序与患者发生矛盾,但医院的安保人员却缺位,对医院的管理提出质疑;对此,网民认为医院应当派办公室人员或保安人员进行现场处置,而不能让专心看病的医生充当保安人员角色,卷入繁杂的排队管理事务中,医院管理需要从加强安保和完善诊疗制度两方面同时进行优化。
3)患者素质议题的舆情情绪特点
“患者素质”的情绪表现是5个议题中最消极的;本文在对医患冲突的舆论事件研究过程中发现,公共舆论已对医患冲突基本持有“医闹”这一先入为主的立场,即使在对事件过程尚未清楚的情况下,存在较多网民认为患者无理取闹在先;从词云图中常见“混蛋”“无赖”等贬义评价,对未有警方通报前传言“插队”的行为表示不满(此处“微笑”是网络表情,意为对医闹事件层出不穷感到讽刺、无奈、无语);对此,网民认为需要有强制措施维持就诊秩序,患者需要尊重医生,遵守规则。
该议题的地区差异也最明显;其中,新疆、江西、广西对患者素质的舆论情绪消极程度一般,而其他医疗水平良好的地区如广东、北京、江苏,事发地上海,舆论情绪的消极度更高;后者属于经济发展较快的地区,信息传播渠道较为通畅,公民的收入和教育水平相对较高,相比于经济发展较为滞后的地区而言,更能理解医护人员,从医生的角度看待日益紧张的医患关系;可见,医患问题的舆论具有一定现实性的地域差异。
4)医疗资源议题的舆情情绪特点
不少网民认为医患冲突的症结是“医疗资源”不足和优秀医疗团队的在地域上的分布不均,即使同一地区,诊疗秩序、管理水平也参差不齐;在本次事件中,患者专程从东北某省赶至上海仁济医院就诊;跨省就医的存在,正是医疗资源不平衡的体现,却也直接挤压其他地区的医疗资源,助长了看病难的问题。
在现实中,北京作为我国首都,毋庸置疑拥有全国第一梯队的医疗资源水平,人均医疗水平最高,但对于“医疗资源”议题,北京网民却持有最高的消极情绪;词云图表示,患者“大老远”“从外地”到外地就医,医生还是需要“加班”“加号”才能满足患者的就医需求;这种矛盾,反映出医疗资源紧张是一个全国性的问题,舆论普遍对此表示不满。
5)医生服务态度议题的舆情情绪特点
在“看病难”问题普遍存在的现实中,由于医疗资源供需的不匹配,医护人员工作强度大的现象极为常见,无法保证患者的就医体验,这使患者对医生产生高高在上、没耐心、不够负责的印象,引起病患或病患家属不满。
不过在此事件中,赵晓菁医生的评价多为良性评价,词云图中常见“专业”、“敬业”、“优秀”等正面词语;相当一部分网民认为需要理解医护人员的工作强度和职业难处,遵守秩序、多加配合。
3. 基于框架理论对舆论议题和情绪的分析
框架指的是人们用来认识和阐释外在客观世界的认知结构,它来自于个体过去实际生活的经验;是每个人在“存在、发生和意义这些问题上进行持续不断的选择、强调和表现时所使用的准则;而引入大众传播领域则表现为“媒介怎样反映现实并规范了人们对之的理解”,即议题、话语和意义是如何被准确建构、组织并得以展开的。
受众同样具有自己的框架——受众框架即受众个人接触和处理大众传播信息的认知结构和诠释规则,这种结构和规则来自于受众过去社会生活经验的积累、既有的价值观和态度、行为取向,并导引着受众个人处理新的信息。
关于医患冲突的新闻报道,虽然在叙述方式上没有突出矛盾和冲突,但是在内容上偏重于依赖官方及其他高权威消息来源,医方话语被强化而患方话语被湮没;甚至在大多情况下,受众只能听到医方的话语空间而根本不存在患方的话语空间,这就导致“医尊患卑”已经成为关于医患冲突的媒介框架,同时也塑造了带有类似观点看法的受众框架。
此次“仁济医院赵晓菁”事件中,从五大议题的关键词词云图来看,当前舆论语境倾向以“优秀”、“尊重”、“良心”等带有正面积极色彩的词语描述医生;而描述患者的词语则一般是“无赖”、“闹事”、“闯入”等,带有负面消极的色彩;上述词语在关于医患冲突的新闻报道同样常见,这显示出受众框架具有“先入为主”的特点;当然,这种受众框架也造成了舆论对于事件的多样化讨论。
五、监测模型建立与回测
1. 数据挖掘各阶段的应用
1)主成分分析
调用python-sklearn机器学习模型工具对五个议题的情绪进行主成分分析,确定五大议题在监测模型中的权重并与作相关性分析;经计算,与地区人均医疗卫生资源都表现出相关性,其中议题1-政府因素与之相关性最为显著,议题3—医疗资源次之。
(主成分分析结果)
2)舆论指数监测模型建立
本文参照模糊数学中模糊综合评价法的思想,对舆情这种较客观的事物进行合理量化;而经查阅大量文献发现,评判舆情的指标主要集中在其烈度、广度、以及其所带主流情绪,依此我们建立如下舆论监测模型。
首先对上述处理得到的新数据集按议题切片,针对其情绪评分、及基本情况(包括数量、认证等级等)进行基于机器学习的主成分分析,把主成分分析的结果作为其权值,与五个议题的情绪得分矩阵进行运算,得出总体情绪综合评分HH。
然后通过计算得出五个议题情绪得分的标准差引入模型中,此处考虑如果舆论矛头突出使得议题情绪得分往往参差不齐,区别明显,最终使得标准差更大;在考虑烈度方面,本文引入上述总体情绪综合评分HH;而在考虑广度方面,本文引入有效评论数量a;最后为了提高本模型对于不同量级的数据和不同强度的监测需求都具有普遍适用性,本文引入敏感度系数ss。
如下所示即为本文所建立的舆论检测模型:
2. 模型下放回测
在建立本模型的中,我们把全体数据作为训练集,再下放到局部进行回测;在回测中我们对于不同评论基数(如江苏&西藏等)都表现出较强的的监测能力。
如:结果显示#广东4月27日23:59之前已经达到监测值,而实际上我们发现,#广东在医疗体制方面的情绪得分与其他四个议题有较大差距,情绪消极程度较低,评论基数庞大,达到检测值理所应当。
依据回测得到的其他数据分析,本模型在其他省份、其他分区的监测结果也贴合现实,依此我们认为回测结果满意,本模型可行。
六、医患冲突事件网络舆情的现实意义与管理建议
微博下的网络舆情具有即时性、聚众化、裂变化等特点,如同星星之火,迅速燎原;在一定的情况下,微博舆情的信息能量能够在很短的时间内迅速释放,很快各种信息和评论就会充斥整个网络空间。
医患冲突这一类的公共突发事件舆论威力巨大,网络舆情痛点几乎指向医疗体制、患者素质、医院管理等事件环境所涉及的所有主客体;此外,每个地方由于经济发展不同步,医疗资源分配不均,网民对于医患冲突事件的态度出现一定的地域分歧。
结合地域发展的多元复杂性,网络舆情的爆发性和裂变化,国内医患关系的严峻性,各地方政府、媒体单位、医院运用舆论情绪监测模型,在舆情发展的不同阶段监测,在扩散阶段适时适当引导和介入;对于预防进一步的舆情危机、为政府医疗体制改革指向、保护舆论事件涉事人员、加强因地制宜的医院管理等改善当前医患关系紧张局面的措施具有重要意义。
1)预防进一步的舆情危机
建立完善的监测和预警机制,以应对医患冲突事件进一步恶化,舆论情绪监测模型为实时观测涉事人员和单位动态提供可能;此过程中,通过有效分析识别可能发生的危险,并提出预防措施,以便应对突发事件,降低甚至消除危机所发生的概率。
2)为政府医疗体制改革聚焦痛点
医疗体制改革是我国医疗卫生事业发展的主推器,紧张的医患关系背后隐含的体制等民生问题在舆论情绪中有所体现;微博舆论此时充当谏言纳策的角色,及时从冲突事件中获取建议,如增加医疗财政投入、协调医疗资源的科学分配、医疗分配供给改革等,舆情监测可以为不同地方政府也能给予更精准的建议和参考。
3)保护舆论事件涉事人员
根据预警,执法机关、行政单位、医院管理方和媒体都更应对涉事的医生、患者方及其他旁观者都进行更全面地采集证言,及时还原事件全貌,及早降低网络舆论的不确定性对涉事人员的伤害;预警信号推动事件透明公开的处理,有助于平息医患冲突舆情的升温。
4)加强因地制宜的医院管理
各地的医疗、经济、文化发展程度不同,情绪监测模型包括了对医院管理的评分,各地医院参考事件本身和自身医院管理的具体情况作出适合,调整更符合自身的诊疗制度、加强安保维持秩序。
5)媒体互动改善医患矛盾语境
新闻媒体除了避免报道把关不严、立场失位等原因的新闻媒体失范,减少医患冲突舆情发生反转,自媒体和新闻媒体都担当起应有的媒体责任和社会责任;在冲突矛盾的语境下,采用更客观、不带有情感倾向的报道,积极与政府单位、医院方进行多方冷静的传播互动,以改善事件发生进程的舆论情绪环境。
本文由 @数据锅 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
- 目前还没评论,等你发挥!