科学家研究使用大数据进行传染病监测

综合时报 2024-11-14 16:22:33
导读 与传统的监视方法相比,源自电子病历,社交媒体,互联网和其他数字资源的大数据具有提供有关传染病威胁或爆发的更及时和详细信息的潜力。由...
2024-11-14 16:22:33

与传统的监视方法相比,源自电子病历,社交媒体,互联网和其他数字资源的大数据具有提供有关传染病威胁或爆发的更及时和详细信息的潜力。由美国国立卫生研究院(National Institutes of Health)领导的一组科学家对这一主题的研究进行了回顾,并将其分析发表在《传染病杂志》(Journal of Infectious Diseases)的特刊上。

传统的传染病监视(通常基于实验室测试和公共卫生机构收集的其他数据)是黄金标准。但是,作者指出,它可能会有时间滞后,生产成本昂贵,并且通常缺乏进行精确监控所需的本地分辨率。此外,它在低收入国家可能会抑制成本。相反,例如,来自互联网查询的大数据流是实时可用的,可以在本地跟踪疾病活动,但有其自身的偏见。科学家认为,将传统监控和大数据集相结合的混合工具可能会提供前进的方向,是对现有方法的补充而非替代。

“最终目标是能够提前数周或数月预测爆发的规模,高峰或轨迹,以便更好地应对传染病威胁。将大数据整合到监视中是朝着这一长期目标迈出的第一步, ”补充剂的共同编辑,美国国立卫生研究院Fogarty国际中心的资深科学家Cecile Viboud博士说。“现在,我们已经通过比较高收入国家的数据集证明了概念验证,我们可以在传统监测稀疏的资源匮乏的环境中检查这些模型。”

流行病学,计算机科学和建模方面的专家合作完成了补编的10篇文章。他们报告了与三种类型的数据相关的机遇和挑战:医疗遭遇档案,例如医疗机构的记录和保险索赔表格;从志愿者那里收集众包数据,这些志愿者几乎实时地自我报告症状;以及通过使用社交媒体,互联网和移动电话生成的数据,其中可能包括自我报告的健康,行为和旅行信息,以帮助阐明疾病的传播。

作者说,但是大数据的潜力必须谨慎控制。非传统数据流可能缺少关键的人口统计标识符,例如年龄和性别,或者提供的信息不足以代表婴儿,儿童,老年人和发展中国家。社交媒体可能不是稳定的数据来源,因为如果失去兴趣或资金,它们可能会消失。作者说,最重要的是,任何新颖的数据流都必须根据已建立的传染病监测数据和系统进行验证。

每篇文章都以使用大数据来监视和建模传染病活动为例,提供了一个有前途的示例:

在美国,研究人员发现,他们将所谓的“流感样疾病”医疗保险索赔数据与美国疾病控制与预防中心报告的经证实的流感活动之间的“出色结合”称为“极佳的一致性”。

作为研究项目的一部分,欧洲的监视系统已开始收集有关流感的众包数据,现在被认为是现有监视活动的补充。Influenzanet使用标准化的在线调查来收集志愿者的信息,这些志愿者每周一次自我报告其症状。许多欧盟成员国现在正在使用该工具,并将其扩展到包括寨卡病毒,沙门氏菌和其他疾病。

美国和加拿大的科学家开发了一个在线平台ResistanceOpen,以监测区域一级的抗生素耐药性。该站点利用了来自社区医疗机构以及地区,国家和国际机构的公开在线数据。分析表明,在线信息与两国的传统报告系统相比,处于有利地位。

多项研究在社交媒体和互联网健康论坛上进行了研究,以获取有关吸毒的信息并发现不良药物反应。尽管存在技术和道德挑战,但作者建议,与传统的基于医生的报告系统相比,互联网搜索日志和社交媒体帖子可以更快地提供信息。

在将流行病预报的相对较新的领域与天气预报的较完善的领域进行比较时,作者指出,鉴于疾病的观测数据较少,并且由于人类行为有可能迅速改变,前者要困难得多。流行的过程。

对空间数据的检查(包括来自保险索赔和社交媒体帖子的数据)显示了其填补地理信息空白的潜力,但同时也提出了必须解决的技术,实践和隐私挑战。

在采取适当措施确保匿名的情况下,来自移动电话的通话数据记录可能会提供“前所未有的机会”来确定旅行如何影响疾病传播。在肯尼亚进行的疟疾和风疹研究表明,通话数据改善了对这些疾病在空间传播的理解。

手动提取和建模了来自公共卫生机构的在线新闻文章和卫生公告,以阐明最近两次疫情的传播方式:西非的埃博拉疫情和韩国的中东呼吸综合症疫情。互联网的发现与传统数据一致,提供了一种概念证明,即这种方法可以推广到各种在线资源并自动进行,并生成有关疾病传播的信息。

研究人员还描述了一种新型的,可公开获得的流行病模拟数据管理系统epiDMS的好处,该系统为大型数据模拟集提供存储和索引服务,并提供搜索功能和数据分析,以在医疗紧急情况下帮助决策者。

虽然结合了传统疾病和数字疾病监测方法的新型混合模型显示出了希望,但科学家们一致认为,仍然缺乏可靠的监测信息,尤其是与诸如气候学等数据集庞大的其他领域相比。“为了产生准确的预测,我们需要更好的观察数据,而这些数据是我们在传染病中所没有的,”补充研究的联合编辑乔治敦大学的Shweta Bansal教授指出。“我们所需要的与我们所拥有的之间存在很大的差异,因此我们希望大数据能够帮助我们填补这一空白。”

如补编中所述,诸如NIH领导的大数据知识计划等多学科计划将有助于扩大大数据在研究中的使用。

免责声明:本文由用户上传,如有侵权请联系删除!