硬核!区块链有助预警传染病!

硬核!区块链有助预警传染病!

区块链大本营 发布在 链头条 海盗号 292061

作者:乌士儿

来源:人人都是产品经理

2020年春节,新型冠状肺炎牵动着大家的心。作为一名互联人,我们能在这场战役中做些什么?这篇文章,作者从专业的角度,告诉我们,很多事情我们都可以做。

2020年,注定是一个不平凡的年份。

笔者怀揣这复杂的心情,在决定写下本文的时候,最新的国家统计的新型冠状病毒感染肺炎疫情数据是:

截止2020年1月29日19 : 26时,中国(含港澳台)确诊6081例,死亡132例,治愈116例;已经感染了除西藏自治区外的全国大部分省份——疫情的扩散速度,直追当年的SARS。

要知道:SARS可是17年前啊,而现在无论国内医疗基础建设,卫生条件,还是配套防疫管理软件都已经突飞猛进,传染病自动化预警和防疫也已达到国际先进水平,我怎么都不敢相信在2020年开春之际,疫情爆发的如此迅猛,如此的措手不及。

怀着对于国内传染病防疫系统的好奇,笔者查阅了大量疾病监测网文献,试图去找到没有成功预防和及时控制疫情的原因。

因为笔者不是医护人员,所以本文不讲如何防治冠状病毒;不是政府工作人员,不是微博大V,所以不谈论事件的功过是非;笔者只是一名IT技术工作者,我试图通过技术性和系统性视角去审视和分析当前国内传染病自动化上报和预警系统的现状,希望采用新技术,新架构提高传染病监测预警的透明性和时效性。

更重要的是:笔者是国家公民,有权利和义务贡献自己的力量参与到国家和社会治理中去。

文中涉及专业系统部分如有偏差请读者及时指正,谢谢!

相关名词:国家传染病自动预警信息系统,传染病报告信息管理系统,医院信息管理系统(HIS),国家传染病网络直报系统(NNDRS),公共卫生数据交换平台,公共卫生管理信息系统,ICD-10诊断编码,人口健康信息平台,传染性非典型肺炎(SARS),电子健康档案(EHR),电子病历(EMR),国家疾病预防控制中心(CDC)

现状分析

目前国家传染病上报和监测预警现状:

我国于 2008 年 4 月在全国 31 个省(直辖市、自治区)就运行了国家传染病自动预警系统,建立了自动预警与响应机制;已实现39种传染病的监测数据自动分析、时空聚集性实时识别、预警信号发送和响应结果实时追踪等功能,目前处于世界先进地位。

同时,我国在除国家传染病自动预警系统外,还相继建设了国家传染病报告信息管理系统以及其核心子系统国家传染病网络直报系统(NNDRS),实现了基于医疗卫生机构的法定传染病病例的实时、在线、直接报告;

为了提高监测数据的完整性和准确性,实现电子健康档案(EHR)、电子病历(EMR)等数据的标准化统一采集,也相继试点和运行了四级人口健康信息平台和其数据交换平台(区、市、省、国家);

为了降低诊疗医生填写传染病报告卡的难度,又打通了医院HIS系统和直报系统,通过诊疗病历自动弹出或人工打开填报页,半自动提交传染病报告卡。

具体系统架构

由于全国各省建设情况不完全相同,我以上图作为参照,重点介绍目前国家传染病报告上报的具体过程:

目前我国传染病报告上报和预警结构

在一些建设较好的省份,可以支持半自动和手工两种传染病报告上传方式,诊治医生可通过医院HIS系统在填写电子病历的时候自动弹出传染病报告上报,上报后的传染病报告卡通过四级公共卫生数据交换平台,对数据格式和完整性补充后(电子健康卡和电子病历)最终采集到国家传染病网络直报系统(NNDRS)中,而国家传染病自动预警系统通过这些传染病报告卡,采用固定阀值法和时间模型法(移动百分位数法、累积和控制图法、聚集性疫情法)以日为单位计算和监测分析39种传染病疫情情况并向基层医院和CDC预警。

上报具体业务流程

再来看看传染病报告卡上报的审批过程:

传染病由临床医生发现后半自动或人工填写传染病报告卡,然后提交院内审核,院内防保科医生审核后,提交给区县和市级疾控中心分别审核和补充,最后通过省级和国家级卫生数据交换平台送往国家传染病网络直报系统中。

基于电子病历直推的传染病疫情报告流程
注:图来自孔园园,高桂玲,张清慧,郭晓芹 基于医院电子病历直推的传染病疫情报告与管理信息系统的实践 2019

无论是系统结构,还是传染病报告卡的审核提交流程都是层层逐级上传推进,并实现分级管理。

而上传的传染病报告卡结构大致如下:

某基层医院HIS系统中的传染病报告卡

为什么这次没有预警

我国的传染病监测体系已经从旧有的人工上报方式发展到IT化和信息化的上报方式,基本实现全国范围内39种传染病数据的汇聚和监测。

相比2003年SARS那会儿,确实是一种非常大的进步,但现实问题是:

为什么在这次重大突发疫情面前,国家传染病自动化预警系统还是哑火了呢?

笔者通过仔细阅读“疾病监测网”的相关论文和文献,分析总结出目前我国的国家传染病上报和预警机制对于新型的重大爆发式疫情所存在严重隐患,具体问题如下:

传染病报告卡其实是一种对已知的ICD-10诊断编码的判断结果,对于新型疾病的确认时间周期长。

从上图大家可以看到,目前国家传染病报告卡是依据ICD-10诊断编码触发的,是对已知39种传染疾病的上报,而对于新型传染疾病需要反复核实和确认,上报判断周期长。

虽然报告卡中有疑似上报选项,但每个医生,每家医院和当地疾控中心的每次上报都承担着相应的个人和机构上报准确性的压力,在没有确定把握的情况下把疑似病例上报本身就是一种胆量(注:国家疾控中心在2020年1月24日也才紧急上线了新型冠状病毒肺炎感染的肺炎的检测新功能)。

传染病报告卡从发现到上报需要3级人工审批,上报是否成功,人为干扰因素太多。

目前传染病报告卡在临床医生填报完成后到上报到国家传染病网络直报系统,还需要3次人工审批,分别是:院内防保科医生审核,区、县疾控中心审核,市级疾控中心审核。

为什么要这么多人工审核?

主要是基于国家传染病上报的对数据的完整性,准确性都有非常高的要求。

采用多机构和人员的核实审批,是一种非常保险和稳妥的方式;但对于突发重大传染病的爆发监测来讲,这是一种重大缺陷。

传染病一旦出现早期流行,来自当地政府的维稳,经济和民众压力都可能影响上报过程的顺畅。

传染病报告卡本来是为传染病的预警监测服务的,但其结构本质却有碍于应对突发重大传染病的监测。

国家传染病预警系统的预警模型本质上是规则模型,只能对已知疾病进行检测和预警。

我国在2008年运行了国家传染病自动预警系统,建立了自动预警与响应机制,预警数据来自于国家传染病报告卡逐级上报的数据。

预警模型主要分为固定阀值法和时间模型法两种,固定阀值法是对15种重大传染疾病设定出现次数阀值,超过阀值就预警的一种事件模型;时间模型法分为:移动百分位数法、累积和控制图法、聚集性疫情法,是对18种传染疾病的探测,其本质是增加时间和空间维度的历史统计分析,对出现比例超过一定百分比的现象产生预警。

目前我国的传染病预警系统的预警模型并不是基于大数据分析的条件模型,而只是基于传染病报告卡的结果规则判断模型。

规则判断模型必须是对已知传染病的判断和预警,所以对新型重大传播的传染病基本没有作用。

国家传染病上报是逐级审核汇总上报,缺乏透明性,应对突发大规模传染病流行有缺陷。

国家传染病上报是在临床医生发现并填报传染病报告卡后,通过医院审核—>区CDC审核—>市CDC审核—>三级数据交换平台—>国家直报系统的逐级汇总的方式;汇总层次多,人工补充数据和审核流程麻烦——这用于日常数据管理还行,应对突发传染病流行就捉襟见肘了。

另外,医院之间缺乏相同症状病人的数据对比,传染病报告卡只纵向上传,并没有横向信息共享,对于对其他医院的提示和预警只能靠国家传染病自动预警系统,手段单一。

 

改进型建议

优化目前的逐级垂直单向国家传染病上报网络,利用区块链分片机制,建立区、市、省和国家四级区块链自动化数据同步网络,在四级网络中依托各级的疾控中心,建立突发传染病数据采集和实时预警自治能力,不完全依赖国家级传染病预警系统。

利用目前已有的公共卫生数据交换平台作为每级数据的交换节点,形成实时自动化的数据交换机制。

各区之间的传染病报告数据在市级防疫链同步;各市之间的传染病报告数据在省级防疫链中同步;以此类推,到国家级同步全国的防疫数据。

四级防疫链像四个车轮一样,在自动化完成各区、市、省的内部防疫预警工作的同时通过国家级防疫链不断更新和补充其他省份的数据,形成具备一定区域自治能力的防疫网络。

四级防疫链

具体细节如下:

建立传染病报告卡初次登记上报和人工核实、事后补充双线异步并行流程

改当前传染病报告卡填写、补充、核实、审批、上报的串行流程为:传染病报告卡初次登记上报和补充、核实、审批双线异步并行流程。

传染病报告卡异步并行流程

目前国家传染病上报体系中对传染病报告的数据完整性、准确性要求太高,故只能逐级核实,补充资料和审核,以至于耽误了传染病上报的最佳时机。

我们都知道:传染病的误报会对当地政府的经济和社会稳定带来很大影响,这也是为什么现在我们宁愿选用更加稳妥的串行审核上报模式的主要原因;但串行审核上报模式的上报责任和压力都在医生,医院和当地CDC中,故极有可能受政府和人为干预影响,瞒报和延迟上报。

众所周知,基于大数据的预警模型对单例数据的完整性和准确性并不做严格要求,数据的规模、范围和时效才是传染病大数据预警的核心。

所以,建议一开始放宽传染病初次上报的权限,医生和基层医疗机构可以直接上报初次传染病报告卡;之后再由防保医生和区,市CDC人员核实和补充该报告卡;而国家传染病大数据预警可以利用初次传染病报告卡提前计算传染病暴发和扩散趋势,从而开展预警和准备工作。

 

分离病历和检查报告数据,增加采集传染病风险性症状数据

传染病报告卡本质上是结论性数据,无论疑似或确诊都需要花大量时间人为确定。

在建立大数据的条件预警模型后,除了采集传染病报告卡数据,传染病风险性症状数据也可以从病历和检查报告中分离出来,自动化识别和上报。

建议国家传染病直报系统增加传染病风险性症状数据的采集,传染病风险性症状数据,例如:发烧、胸片描述、咳嗽、生化指标等,可通过非结构化数据分析分离和识别,关键传染病风险性症状标签,通过四级卫生健康数据交换节点自动上传。

由于并不是直接上传传染病报告卡,所以对社会稳定和经济并没有直接影响,而对于大数据预警来说可以增加数据的范围和规模,提高预警精度。

而且传染病风险性症状数据的上报把压力从医生,医院和当地CDC那里转移到四级卫生健康数据交换节点,用自动化代替人工填报,减少了基层的担责压力。

采用大数据条件分析模型,补充原有的规则事件模型,建立国家和基层的双层预警网络。

上面已经讲过:目前国家传染病自动化预警模型其实是规则模型,规则模型只有预警作用,没有预测作用。

建议国家传染病自动化预警系统建立一套“大数据条件分析模型”作为离线预测、预警支持库,采集除“传染病报告卡”以外的“传染病风险性症状数据”和“互联网数据”。

例如:机票预订、药品供应、搜索数据等,构建国家级的传染病顶层离线预警网络。

同时依托于四级防疫链数据实时同步能力,通过区块链智能合约建立基于规则模型的数据实时判断预警能力;将目前的国家传染病自动预警功能下沉到各区,市和省级的防疫链中,形成基层实时预警网络。

国家级的传染病顶层离线预警网络和基层实时预警网络双层同时作用,可以兼顾预警的实时性和预测的大数据分析能力。

建立基于医院和当地CDC的分布式,点对点,传染病报告数据共享网络。

区、县级医院,区CDC,市级CDC目前是传染病报告的基本窗口,医院和CDC有上报传染病病例的义务和责任,是国家统筹监测、预警和控制疫情的基础。

但对于医院判断当前疫情的整体态势来讲,却只能通过各地逐级汇总后的传染病报告,经CDC统计后由上至下的统一告知。

我们知道:重大疫情的爆发往往具备突发型的特征,而在疫情早期,在第一时间、多医院、多区域横向同步报告数据,将极大增强医生,医院勇于上报疫情的信心,为一线医护工作者提供疫情态势感知,提前准备物资防护提供了基础保障。

建议构建区、市、省、国家级区块链防疫链,实现跨医院,跨区域的疫情数据自动化同步能力,在四级防疫链中通过四级卫生健康数据交换节点实现跨区域和层级的数据交换。

单链通过区块链自动化节点数据同步能力实现区域内的数据同步;四级防疫链通过智能合约可以实现一定基层自治预警能力,可以在疫情爆发早期,在区域内提前控制疫情和范围。

基层自治型预警

建立基于区块链的防篡改和透明性的上报数据追责存储机制。

我们不希望有重大疫情爆发,但爆发后除了积极控制疫情,治愈患者,清除疫情所给社会和经济带来的不良影响,还要积极总结经验教训。

我们需要一套完善的追责体系,需要给老百姓提供一个透明化监督和事件追责的数据依据,无论是医院、当地CDC、还是政府管理者可以通过区块链的防篡改和透明性特征自证一二。

无论接诊,疑似处理,确诊处理,死亡还是报告上报,都可以在老百姓和上级主管政府的监督下开展,一旦重大疫情追责,可以依托区块链数据可溯源的特性形成完整的,防篡改的责任链条,可以极大增强政府的公信力,为防疫和控制疫情提供坚实的群众基础。

 

总结

笔者经历过2003年的SARS疫情,这17年以来看到国家在信息化技术和移动互联网技术建设方面突飞猛进,不相信以目前的技术手段我们不能充分应对重大传染病疫情的早期预警和控制(要知道:这次疫情和SARS时代处于完全不同的两个信息化和自动化技术层面)。

我们国家相关行政部门要敢于接受和勇于尝试新技术,用技术来武装重大疫情的防疫体系——毕竟在人命关天面前,其他的都是次要的。

评论(1)
登录 账号发表你的看法,还没有账号?立即免费 注册
  • 上一 2020-02-08
    卫健委需要有一个类似铁道部的铁腕领导,可成