|
|
|
|
移动端

预防自杀,大数据也在致力于挽救生命

12月10日,深圳中兴网信科技有限公司研发组主管欧某在中兴大楼坠亡,经初步勘察判定排除他杀。自杀作为日益严重的公众健康问题,越来越引起人们的关注,除了惋惜之外,我们也应该思考如何科学预测、预防自杀。

作者:刘文清来源:THU数据派|2017-12-18 13:26

年前最后一场技术盛宴 | 1月27日与京东、日志易技术大咖畅聊智能化运维发展趋势!


自杀事件频发引重视

12月10日,深圳中兴网信科技有限公司研发组主管欧某在中兴大楼坠亡,经初步勘察判定排除他杀。据其妻子公开发文中显示,欧某于12月1日首次被领导告知辞退意向,这之后的10天里与公司多次围绕辞退事宜进行谈话,期间欧某曾受到公司的恶意中伤和压低赔偿,于12月10日坠楼身亡。此事件引发了大量网友关注和热议:

舆情走势显示,各平台网友对此事件的关注度在12月10日坠楼事件发生后开始出现高峰。

而根据清博舆情监测系统对全网情感属性的检测结果显示,网友负面、正面、中性情绪占比均在三分之一左右,可见此事引发的网友观点并没有一边倒向讨伐中兴,支持员工。出现这样的结果,可以从知乎上“如何看待 12 月 10 日中兴通讯 42 岁研发负责人坠楼事件?”这一话题中获赞2w+的回答找到原因,回答客观分析了在行业衰落的大背景下,公司裁员、压低股票的做法是正常的,我们需要做的是怎样避免受到客观问题的影响。

因此,舆论观点除网友为坠楼员工发声之外,也有不少人表达出了对现实问题的无奈。在互联网内外,公司调整牺牲员工利益之事时有发生,失业降薪、财政困难、家庭责任是每个人已经遇到或一定会遇到的问题。不知道欧某到底出于何种真相才选择抛下父母妻儿选择自杀,但无论是出于何种原因,一条鲜活的生命就这样消失了。

有数据显示,全世界每年约80万人死于自杀,中国每年至少28.7万人(其中,约10万名青少年)自杀,200万人自杀未遂,平均每分钟2人自杀,8人自杀未遂。这样高的自杀率已经引起了各国研究者的关注,利用大数据预测和预防自杀也成为了一大研究方向。

预测预防自杀研究现状

今年2月,一女孩直播自杀的视频传遍美国社交平台,引起一片哗然。对此,Facebook3月宣布将利用AI识别自杀倾向用户,并表示将大力加强自身的自杀预防工具,利用人工智能技术来识别有自杀倾向的用户,从而保障Facebook社区环境的安全、健康。

弗罗里达州立大学研究者领导的开创性项目也在自杀预测方面取得了巨大的进步——利用机器学习预测自杀倾向风险。该研究通过梳理2百万病人的电子健康记录的数据库,根据其中包含的可能导致自杀行为的详细病史,利用机器学习进行检查,学习因子的组合方式,以最大化自杀倾向预测的准确率,从而开发针对自杀行为风险的预警系统。该研究得到了一个十分吸引人的结论:机器学习能预测最多两年之后某人的自杀倾向,准确率高达80%~90%。该方法在越接近某人的可能自杀日期时还会变得更加准确,比如针对一般的医院病人,在试图自杀的前一周准确率攀升到92%。

前不久,清华大学计算机系教授、数据科学研究院计算心理健康研究中心主任冯铃在讲座中介绍了中心针对预测预防自杀所做的研究,该中心的研究内容包括感知压力、疏导压力两个方向。

在感知压力方向,中心对传统心理学量表、穿戴设备所检测的生理信号以及社交网络中的在线遗书等数据进行分析,以监测压力并判断压力类型和级别。对此,中心建立了一个特征模型,利用文本分析、情感分析、数据挖掘、意见挖掘等常用的方法,监测持续性慢性压力、压力类型种类及其波动状态图,并对以下暴露心理压力等自杀因素的六大特征进行监测:

  • 负面情绪词在微博中占比
  • 自我关注词在微博中占比
  • 自杀词汇在微博中占比
  • 遗言词在微博中占比
  • 社交媒体上的活跃程度
  • 不同情绪之间的转移

随后,分析这些特征的权重,把所有的数据量化之后,开始跑机器学习模型,用各种优化算法,比如遗传算法来学,降低检测误差。

在疏导压力方向,中心构建了“清华帮”平台,作为落地的应用。该平台通过分析用户在平台上发布的带有文字、图片及发布时间等信息,有效实现压力疏导。平台使用者可以表达自己的愿望、问题,或解答问题,在隐私保护方面,所有的用户消息都会定期清理。系统后台有算法来做支撑,例如推荐算法推荐合适的用户解答问题。

预测预防自杀研究发展方向

显然,不同国家的学者都意识到了自杀率高这一问题的严重性,纷纷开展对预测预防自杀的研究。但在此过程中,仍然存在许多有待解决的困难,如何解决这些问题也必然将成为该研究领域的发展方向:

  • 建立合理的隐私数据准用机制

预测预防自杀需要研究医疗、社交等多源头大量的数据,而医疗数据的获取往往受到数据隐私保护的限制,想要拿到真实、全面的医疗数据非常困难。社交数据同样存在这一问题,微博、博客等公开数据的获取较为方便,微信朋友圈、个人通话和信息等隐私性较强的数据难以获取。但往往最隐私的信息最能暴露更多的自杀征兆,所以,建立合理的隐私数据准用规范和机制将使得研究获取更多数据,从而提高研究结果的准确率。

  • 研究成果落地,完善预警系统

所有的研究都应该遵循问题引导,并寻求应用落地。利用大数据人工智能、机器学习等手段进行自杀预测和预防正是以自杀率搞这以公众健康问题为背景,但是目前的应用落地还不能很好的实现。数据科学研究院计算心理健康研究中心研发的“清华帮”目前仅是一个小小的应用产品,面向更大受众群体的落地应用还有待开发,例如建立全国范围的自杀预警系统。此外,预警系统建立后还将面临更多的问题:系统报警后,谁来实地执行对有自杀倾向的人员进行救治?如何及时赶到自杀现场?针对有自杀倾向的人群,如何有效疏导和缓解他们的心情?这期间需要警力、心理专家等多方协作和执行,才能真正促使研究发挥实际价值。

自杀作为日益严重的公众健康问题,越来越引起人们的关注,除了惋惜之外,我们也应该思考如何科学预测、预防自杀。相信随着研究手段的不断增加和研究成果的不断产出,在不久的未来,人们可以通过大数据和人工智能,更有力地避免悲剧发生。

【编辑推荐】

  1. 大数据之路依然还很长,看你怎么走
  2. 大数据还是“大忽悠”? 解决问题、贴近业务才能“接地气”
  3. 学会网络推广数据分析,你将省下一大笔推广费用!
  4. 大咖说:2017年,我眼里的大数据领域惊喜
  5. 关于大数据在电子商务中应用的4点认识
【责任编辑:庞桂玉 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

UNIX到Linux的移植

本书讲述怎样把UNIX环境下的应用程序移植到Linux环境上运行,是一本综合的开发和解决问题的参考手册 。本书详细描述了当前IT行业中被广泛应...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊