如何使用疫情数据做ETS预测?

这一波国内疫情来势汹汹,全国上下一心,众志成城,各地艰苦的抗疫正在进行。

数学竞赛强调问题解决思维,做“Problem solver”,重视实际场景下的应用,虽然我们还是学生,但也要去理解现实社会。抗疫之下,无论我们的学校是否停课,所有学习数学竞赛的同学们并不置身事外,我们可以积极地去思考。

阅读须知:

1.本文的主要目的是以上海新一轮确诊病例数据为例,介绍一种数据预测方法。任何一种预测方法都有其局限性,大家不必纠结于最后的预测结果。

2.本文讨论的确诊病例不包含无症状感染者。

3.希望同学们在生活中学会关注数据、查找数据、分析数据、解读数据,具备独立思考与问题解决能力。

数据来源与分析

上海4月底净增“清零”?疫情数据教你ETS预测!

这一轮上海疫情是从3月初开始萌芽,老师找到了自3月1日起官方通报的历史数据(来源:国家卫健委)

不难看出,从3月1日到3月12日,新增确诊病例主要由境外输入导致,本土新增病例几乎保持在个位数较低水平;自3月13日起,本土新增病例增多,成为新增病例的主要来源。

通过上图的新增境外输入病例趋势线也不难看出,新增境外输入病例增长呈下降趋势,对于新增病例的贡献趋近于0。

ETS计算方法与数据预测新增本土确诊病例及预测

上海4月底净增“清零”?疫情数据教你ETS预测!

根据指数平滑算法,本土新增病例数预测将于4月30日增长至347。

指数平滑法(ETS)是一种常用的时间序列预测局部统计算法,所谓时间序列就是同一统计指标的数值按其发生的时间先后顺序排列而成的数列

指数平滑法(ETS)计算输入时间序列数据集中所有观测值的加权平均值作为其预测。权重随着时间呈指数递减:

上海4月底净增“清零”?疫情数据教你ETS预测!

其中,α介于0-1,α值接近0表示在对未来值进行预测时,对最新观察值的权重很小;相反α值接近1表示在对未来值进行预测时,对最新观察值的权重很大。

在预测时,既可以根据经验主动设定α的值,也可以通过历史数据求得一个使得历史预测和真实值误差最小的α,本文的预测方法皆采用后者

新增治愈人数及其预测

那么用同样的方法,我们接下来看每一天的新增治愈人数及其预测:

上海4月底净增“清零”?疫情数据教你ETS预测!

新增治愈人数预计将于4月30日增长至74人。

因为omicron自身特点,其传播率强,但致死率不高,同期上海累计死亡人数保持7人不变,新增死亡人数为0。

在这样的基础上,我们假定未来境外输入病例为0,新增死亡为0,同时假定新增本土确诊病例及新增治愈病例按照按照指数平滑算法增长。同时我们依据最新(截止到3.29)的数据累计确诊人数——5729人为基数,按照公式:

上海4月底净增“清零”?疫情数据教你ETS预测!

其中,因为我们假定境外新增病例人数为0

上海4月底净增“清零”?疫情数据教你ETS预测!

标红的两项为预测指标。

现有确诊人数及其预测

上海4月底净增“清零”?疫情数据教你ETS预测!

根据预测,到4.30也就是五一假期前夕,现有确诊病例仍将成指数型增长,我们现在处于指数型增长的底部。

这里有一点需要说明:因为我们正处在确诊病例快速增长的时期,因而最新观察值(也就是近期的高增长)权重会相对大一些,会使得预测数据往更大值靠近

在这基础上,我们做一个简化处理:以历史数据出发,计算每天的新增确诊增长率和每天的新增治愈增长率,并假定历史数据适用于未来,在这样的场景假设下,目前已知数据(截止到3.29):

1. 现有确认人数为779人

2. 每天的本土新增病例增长率22%

3. 每天的新增治愈增长率6%

按照最新(截止到3.29)新增本土确认病例数据326人,以及最新新增治愈病例数据45人,在22%新增病例增长率不变的情况下,新增治愈增长率必须从明天起提高至30%,这样到4.30那天净增确诊病例人数才能够实现清零;

如果我们保持6%治愈率不变,新增病例增长率则需要降低至-0.4%,这样到4.30那天净增确诊病例人数才能够清零

写在/最后

当然,我们的数据分析与预测只是基于一个被高度简化的模型很多现实因素没有被考虑进来,比如政府正在加强管控,比如新增病例的快速增加和检测力度的增强密不可分。

此外,预测数据还有很多各种各样不同的方法,每个方法使用的场景及其利弊也各不相同,对数据感兴趣的伙伴们可以专门针对此进行学习~

疫情当下,我们每个人能做的就是配合政策,日常注意防护,保持积极心态!尤其祝在上海的伙伴们,抢菜顺利!

【竞赛报名/项目咨询+微信:mollywei007】

上一篇

2022美国TOP30大学中国学生录取数据公布

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部