大数据挖出微博抑郁 约200用户被人工判定为抑郁患者

回复 星标
更多
大数据挖出微博抑郁 约200用户被人工判定为抑郁患者»

近日,哈尔滨工业大学“社会网络与数据挖掘”联合实验室与国内社交媒体数据挖掘公司“宏博知微”合作开展研究,利用研究构建的抑郁倾向识别模型,在新浪微博近亿用户中识别出了几百名重度抑郁症患者,该研究结果经医学机构确认准确度达到了83%。相关人士表示,这项研究结果或成为抑郁症临床诊断之外的新兴诊断方法

该项研究由哈工大“社会网络与数据挖掘”联合实验室与国内社交媒体数据挖掘公司“宏博知微”共同开展。实验室负责人哈工大博士于霄告诉南都记者,他是在微博上几位抑郁症患者自杀事件发生后开始关注抑郁症患者这一群体的,“仔细看这些人的微博,非常触目惊心,负面情绪在每一条都很明显,当时我们就感叹,如果通过数据识别这一群体,让其亲友能早点干预,也许可以避免悲剧发生。”据公开数据,自杀人群中有 63.5% 患有抑郁症,但仅 9% 在自杀前曾到精神科或心理咨询机构就诊。利用大数据来识别个体抑郁倾向及自杀倾向,或能及时挽救更多抑郁倾向人群的生命。

该预测模型会扫描微博用户语言中的抑郁相关关键词

如何识别抑郁群体?于霄和同事首先是挑选新浪微博用户中被确认为抑郁症的人群作为样本,通过计算机强大的计算能力分析样本数据,从这些数据获取出规律后建构预测模型。有了数据模型,计算机就可以用这一模型扫描新浪微博上过亿用户了。

“计算机算法会包括自然语言处理、时间序列、机器学习等,比如失眠在抑郁症患者中发生比例非常高,会成为语言处理的关键词,机器还会对关键词出现的频率和时间段打分。”于霄说道。

计算机最终统计的数据比他们想象中要更为丰富:存在抑郁倾向的微博用户与普通用户发博时间有明显差异,这部分人群发博高峰在23点,其夜间活跃度比普通用户平均约高出30%。该群体微博关键词为:死、抑郁症、生命、痛苦、自杀。有60%为女性,40%为男性,女性比例比男性略高,也与之前两位女性微博用户@走饭、@ sienna赛娜因抑郁症而自杀的报道相符。2012年3月20日,新浪微博用户@走饭在微博发布定时遗言后辞世,后被警方证实为因抑郁症自杀,此事引起了数万网友的关注,也使得一些有心人开始思考微博言论与抑郁症之间的可能联系。

普通微博用户与抑郁症用户微博使用对比图

“有很多数据是很值得关注的,比如有些表现出抑郁症倾向的用户除了喜欢用小号来表达痛苦情绪,还有群落聚集趋势,他们会同时关注很多其他同类人群,有的甚至会习惯每天到已经自杀的用户微博上评论‘今天你还好吗?’,这听起来有点瘆人。”

截至目前,实验室从识别出的抑郁倾向用户中,辅以人工判定约200名抑郁症患者,研究者发现,有多人在微博中称准备自杀。

据于霄介绍,除了抑郁倾向人群外,精神类疾病、危害社会行为(有暴力倾向人群)也是实验室数据研究的方向,希望能够对这些人群的提前干预提供数据支持。(来源:南方都市报 | 责任编辑:骆玉龙 )

2015-02-12 13:24:36更新过
新窗口打开 关闭