财新传媒 财新传媒

阅读:0
听报道
昨天,发了一篇用简单的逻辑推算武汉的潜在患者人数的文章,得到了不少读者的留言。里面有支持的,有批评的,这里一并表示感谢。
 
今天的确认人数暴增1771人,其中湖北新增1291人。坦率的说,这个数字在意料之中。我昨天写的这篇文章,从某种意义上就是因为预测到了这个数字,今天,想和大家再多唠两句。
 
 
对我文章的批评中,首先是认为我的逻辑推理太简单,就是小学三年级的乘除法水平。这个我承认。流行病学有很多复杂的模型,统计学也有各种理论和模型,但我认为现在用不着。我好歹也混了个经济学博士,一些基础的模型知识也是知道的。
 
社会科学,特别是经济学中的数学模型,我个人观点是有时候为了模型而模型,为了让论文高深一些,就做一个特别复杂的数学模型。我并不是说模型不好,而是社会科学不像自然科学,社会科学的数据准确度远远比不上自然科学可以算到小数点之后七八位。做模型有句话叫垃圾进,垃圾出。意思是如果数据不准确是垃圾,模型做的再好,结论也是垃圾。在数据不准确不完备的情况下,模型越复杂,结果有时候越离谱。
 
这次新冠病毒的研究,目前的数据就是严重不完备的。现在针对这次流行的学术论文中,基本传播数(R0)的估计,低的1.4,高的有5。有点模型概念的朋友知道,这个指标对模型预测结果有多大的影响。R0 1.4和5,最终的模型结果能差出几个数量级。纵然模型做的再复杂再完备,没有准确数据输入,结果一定非常离谱。有时候真不如小学三年级的算术。
 
大家有时间可以看看海外流行病学者对这次的初步研究,结果数字很多超级离谱。我在微信群看到一张预测模型截图,大致结果就是预测2020年9月全人类灭亡。我完全不同意他们的结论,所以也不想引用数字,大家可以去网上自己找。
 
有时候计算简单不代表不准确,关键是逻辑是否合理。著名咨询公司麦肯锡在面试时的一种题型叫Guesstimate。翻译直译就是“瞎猜”。题目大概是一架波音747里面能装几个兵乓球或者一年北京能卖出几个萝卜丁口红这种不靠谱的问题。但为什么咨询公司把这些瞎猜问题做为面试题呢?就是看里面的逻辑推理过程是否合理,如果逻辑推理是合理的,基础数据输入也比较准确,就算非常简单的计算,也能得出一个差不多的结果。
 
 
很多读者和我说我的死亡率(或者病亡率)的计算不准确。准确的计算应该是死亡人数 / (死亡人数+治愈人数)。这个完全正确。但这个算法只有在全部流行过程结束后,等到所有患者死亡或者治愈后,才能用这个公式计算,那时,算这个数据也只有事后总结的意义了。
 
我这个直接的死亡人数 / 确诊人数的计算确实不靠谱,没考虑病程,没考虑很多因素。但是,死亡率只是引发我怀疑的原因。我的整个的逻辑推理和感染人数的计算,也完全没用这个数字呀...... 我文中开始说,我自己发现简单计算的死亡率武汉比湖北省外高出很多,产生了合理怀疑。同时总结了这个死亡率高的几个原因。
 
1. 武汉的确诊数量远小于实际患者数量
 
2. 武汉的医疗机构被挤爆,导致重症患者不能得到很好的医治,死亡率偏高
 
3. 外地病患处于比较早期阶段,还没发展到死亡案例
 
4. 武汉病患多为初期首次传播,病毒毒性更大(第一批41个案例中死亡率高达15%)
 
这四个原因中第三个就是病程因素。读者也指出了,武汉去外地的人中青壮年比例大,所以死亡率低。这些都是影响原因。所以死亡率这个数据不靠谱,所以我后面的推导就没有用呀,死亡人数也没用呀..... 大家批评我死亡率估算不靠谱,我都同意,我也觉得不靠谱呀。所以死亡率差异,我只作为一个怀疑的原因,而不是后续计算的依据。后续计算,既没有用死亡人数,也没有用死亡率这个指标。
 
不过,自媒体的文章相信大家也不会仔细看。大家有误解首先是我文章写的不好,这里鞠躬道歉了。
 
 
我推理的核心假设是,总人口感染率在留在武汉本地人、从武汉去湖北的人和从武汉去外省的人应该是一致的。具体来说,就是武汉的患者占目前留在武汉900万人口中的比例,和湖北其他地市的从武汉来的患者占从武汉去其他湖北地市的总人口的比例,和外省从武汉来的患者占从武汉去外省的总人口的比例,这三个比例应该基本一致。这个比例我称之为总人口感染率。
 
目前,死亡患者中老年人是大多数,但感染患者中,老人、青壮年、儿童都有,目前主流说法也是新冠病毒感染是不分年龄的。同时,武汉因为有更多患者,医疗资源过载,交叉感染几率更多,因此照理说武汉当地的总人口感染率,至少不应低于外省和湖北其他地市的总人口感染率。从保守起见,估计这三者感染率一致是一个保守假设。
 
这样,武汉本地人口900万,武汉到湖北其他地市 500*65% = 325万,武汉到外省 500*35% = 175万,这是三个总人口基数。
 
后面需要估计外省的总感染人数中,有多少人是武汉输入案例,是武汉到外省这个175万人中产生的。这个是可以准确计算的,需要一个个省份分析里面确诊案例中,输入型案例占几例,本地占几例。但是因为我自己时间有限,就拍脑袋算了一个90%。现在看这个指标大大高估了,合理应该是60%左右。而且随着时间推移,本地案例比例会越来越高,这个指标会继续下降。
 
最后,就是三年级小学乘除计算:
 
武汉的预计感染人数 = 外省确诊人数 * 武汉输入型案例占比 / 175 * 900
 
根据最新一天的数据,计算结果是:
 
武汉的预计感染人数 = 1883 * 60% / 175 * 900 = 5810例。
 
确实是小学三年级的数学。但我在现在数据缺失不准确的情况下,我并不认为这个估算比那些复杂的模型差太多。另外,这个数据我个人认为还是低估的。因为未来外省还会继续发现武汉输入型的病例,同时武汉本地的感染率应该比去外省的武汉人更高。
 
其实我们日常生活中,碰到的99%的事情,用最多用到高中数学的知识就可以推导出一些很有趣的结果。
 
(另外,经读者提醒,1月17日,Imperial College London 的一位流行病学教授,有一篇学术论文以海外确诊案例人数和武汉机场国际航班吞吐量构建了一个更复杂的模型。我的预测逻辑和他的类似,但之前我没有读过他的这篇文章,我的计算方法也简单很多,基本大家都能看懂)
 
 
为什么我写昨天那篇文章呢?
 
我一直认为对待疫情,应该既重视又冷静。重视代表我们要用一切手段隔离,防治疫情。因为新冠病毒的潜伏期症状不明显而且可传染,是比SARS更隐蔽更难检测的病毒。封城是非常必要的举措。包括不出门,勤洗手,戴口罩都是必须的。但是,也不能过于恐慌,一点头疼脑热就觉得得了新冠肺炎,去挤兑医院,去超市抢购。现在,我相信每个人都已经充分重视新冠肺炎了,要注意的反而是不要恐慌要冷静。
 
前几天,我感觉到武汉的实际感染人数可能超过当时的披露数。就感觉存在一种风险,就是一旦武汉把之前没有披露的感染人数开始释放出来,就会出现很短时间内武汉乃至湖北的确诊人数暴涨。这个如果一旦开始披露,会在民众中造成新一轮恐慌。民众会认为封城不出门这些隔离手段都没能阻止病毒蔓延。之前武汉本地的恐慌情绪,就是之前政府一直强调没事没事,大家也都觉得没事。突然一下封城,这个反差让很多人一下子就慌了。
 
昨天上午,一天披露了3000多个新增疑似,我当时就觉得这批患者要还是往外放了,于是就写了那篇文章,想以自己绵薄之力,告诉大家,武汉将出现的确诊暴增,不是因为病毒加速传播了,而是因为本来就有这么多人,只是开始披露了而已。封城和我们其他所有的隔离措施,都是有效的。
 
我上篇文中加粗了如下一段话:
 
“请大家一定不要为每天上升的确诊人数而担忧。我现在最关心两个数据,第一是湖北之外有没有大规模的本地传播发生,第二是湖北之外的死亡人数。这两个情况,截止到27日早上,都还好。武汉的患者人数肯定比想象的多,但是,以目前的力度,我自己感觉真实新增的患者已经在往下走了。”
 
这其实是我上篇文章最想表达的。今天,湖北单日新增确诊1291人,武汉单日新增892人。数字和我预想的差不多,这部分患者还是逐步确诊披露了。我上篇文章全部的分析,都是希望大家不要因为这两个数字而过份担忧。
 
因为本人水平有限,这些内容没有充分在文中表达清楚,反而加大了一些读者的恐慌情绪。这里再次表达歉意。
 
针对死亡率问题,现在确实数据不足,时间不够长,但基本业界专家的看法都是死亡率低于SARS,会低于3%。我自己拍脑袋的预估是1%-2%。这个确实目前没有足够资料证明,大家就当成我自己的美好愿望吧,不要太过苛求是否准确了。
 
 
有几个读者批评我行为不严谨,没有注明数据来源和引用。这里首先道歉。
 
本人不是专职写公众号的,有一个累成狗的工作。写号也是无意之举。2018年底,由于工作不顺,写了几篇文章在朋友圈发,其后就有朋友撺掇我写公众号。一个做相关业务的朋友就帮我搞了一个公号,我就时不时写上一篇。写文也没什么主题,之前写的基本以时政评论为主。
 
内容基本都是随笔,不是学术论文,所以也没按照论文的标准写作。本身写文是业余爱好,并不以此为职业,所以也不打算太过正式,这方面请读者见谅。
话题:



0

推荐

西西弗评论

西西弗评论

72篇文章 2年前更新

清华大学五道口金融学院博士

文章