第37卷  第4期 福  建  电  脑 Vol. 37  No.4
2021年4月
Journal of Fujian Computer
Apr. 2021
———————————————
本文得到教育部大学生创新项目基金 (No. 202011775158)、中央高校基本科研基金基金 (No. ZY20180121)资助。任晓龙,男,2000年生,主要研究领域为数据分析。E-mail:*****************。李忠(通信作者),男,1966年生,主要研究领域为数据挖掘。E-mail:****************。申天恩,男,2000年生,主要研究领域为数据分析。E-mail:*****************。毛亦鹏,男,2000年生,主要研究领域为数据分析。E-mail:*****************。宋俊杰,男,2000年生,主要研究领域为数据分析。E-mail:****************。
Logistic 回归模型对美国新冠疫情预测研究
任晓龙 李忠 申天恩 毛亦鹏 宋俊杰
(防灾科技学院应急管理学院 河北 燕郊 065201)
摘  要 为了预测美国新冠肺炎疫情变化趋势并探索其背后的深层原因,以便为我国制订针对性政策提供借鉴,本文采用Logistic 回归方法对美国新冠肺炎确诊人数建立预测模型,通过实际数值进行拟合预测分析。计算结果表明,在新冠肺炎疫情发作的前中期,Logistic 模型拟合预测的情况与实际数据基本吻合,具有较高的预测精度,可用于新冠肺炎感染确诊人数的初期预测,这对我国新冠肺炎感染者人数预测具有借鉴意义。  关键词 Logistic 模型;数值拟合;感染确诊人数;借鉴意义  中图法分类号  TP399  DOI:10.16707/jki.fjpc.2021.04.011
Study on the Prediction Model of COVID-19 in the United States Based on
Logistic Regression
REN Xiaolong, LI Zhong, SHEN Tian’en, MAO Yipeng, SONG Junjie
(Emergency Management Institute, Institute of Disaster Prevention, Yanjiao, China, 065201)
1 引言
2020年,欧洲和美国的新冠肺炎疫情爆发。由于这些国家采取了消极的抗击疫情政策——自然免疫法,
病毒传播速度极快,导致疫情在这些国家大规模爆发。截止2020年11月27日,美国新冠肺炎累计确诊病例超过1300万例,累计死亡264624例,是全球累计确诊病例数和累计死亡病例数最多的国家。
从新冠肺炎爆发之初,国内外的学者就开始进行确诊人数分析和趋势预测,并发表了大量的学术论文。王旭艳等人采用时间序列分析,利用求和自回归移动平均模型(ARIMA )进行建模并做出预测,获得了较好的结果[1]。盛华雄等人将疫情传播分为两个阶段,即控制阶段采用SIR 模型和差分递推方法分析预测,自由传播阶段运用Logistic 模型比较分析,说明了及时采取防疫措施的重要性[2]。曹盛力等人通过修正SEIR 传染病动力学模型对湖北省
疫情进行预测和评估,结果表明修正的SEIR 传染病动力学模型可用于COVID-19传播态势分析[3]。由中国新冠肺炎预测分析模型推广到美国的疫情传播趋势预测,从而对美国疫情发展进行预期,以采取相应的应对措施,对人类健康具有重大意义。
本文以美国新冠肺炎疫情发展为研究对象,通过Logistic 模型建模,分析预测美国新冠肺炎发展趋势及导致疫情不断增长的原因,从中总结经验和吸取教训,反过来为我国疫情防治提供决策依据。
2 数据来源及特征分析
2.1 数据来源
本文所用数据来自约翰·霍普金斯大学系统科学与工程中心(JHU CSSE )运营的COVID-19病毒数据库[4],时间自2020年1月22日到2020年12月20日,共334天,覆盖美国全国,主要包括三类数据:新冠肺炎确诊人数、治愈人数和死亡人数。通过编写程序将原数据合并,整理成Json 格式
48 任晓龙等:Logistic回归模型对美国新冠疫情预测研究第4期
以便后续使用。
2.2数据特征分析
为查看美国新冠病毒感染确诊人数、累计死亡
人数和治愈人数的发展趋势,将所获取数据按照时
间序列进行统计,结果如图1所示。
图1  美国新冠肺炎疫情累计人数趋势图
从图1可以看出,美国的新冠病毒确诊人数呈现快速暴涨的趋势,尽管治愈人数也在增加,但与确诊人数相比还是变化缓慢,而累积死亡人数也在稳步增加,说明美国的防疫措施表现乏力。
若以每日新增人数为研究对象,按照时间序列进行统计分析,结果如图2所示,其中蓝线为每日确诊人数,绿线为每日治愈人数,红线为每日新增死亡人数。可以看出,每日确诊人数呈现快速增加趋势,说明采取的防疫措施和政策不给力;治愈人数也表现出增加趋势,说明相关方案比较见效,但总体还是低于每日确诊人数。由于每日确诊人数与每日死亡人数相比太大,因此在图表上每日死亡人数呈现平缓趋势(图2的红线),但是实际死亡人数情况如图3所示。可以看出,在3月中旬后的一段时期,每日死亡人数暴涨;而进入2020年冬季以来,死亡人数又呈现快速增长趋势,如12月1日新增死亡人数高达2597人。这说明美国特朗普政府对新冠肺炎疫情没有好的医疗对策。
图2  美国疫情每日新增人数趋势图
图3  每日新增死亡人数图
从图2和图3可以看出,美国新冠肺炎疫情不断升级,这与美国社会长期存在的种族主义问题、今年的总统大选、民众对特朗普政府应对疫情政策不满等导致社会撕裂有很大关系。下面是一些事件的时间点:2020年5月25日,46岁的美国明尼苏达州黑人男子弗洛伊德在警察后死亡,之后数天爆发了波及全美国境内的大规模抗议游行。7月4日,美国独立日,各地民众庆祝,上街大规模游行。8月23日,威斯康星州基诺沙市,警察开击伤29岁黑人男子雅各布·布莱克,致使布莱克处于瘫痪状态。这一事件又引发美国民众连日抗议示威。11月19日,美国内布拉斯加州奥马哈发生一起警察击黑人
男子致其死亡事件,引发民众愤怒,此后数日举行示威抗议活动。可以看出,美国因警察击黑人事件导致的一系列示威游行,加上驴象之争的大选对垒,加剧了社会动荡不安;大规模人集结,加快了新冠肺炎病毒传播的几率与速度;再加上特朗普政府的“自然免疫”不作为政策,必然导致新冠肺炎确诊人数暴涨,死亡人数也随之水涨船高!
3数学模型建立与结果分析
自然界生物种的增长趋势,类似于一条“S 型”曲线,在起初阶段大致呈指数增长,随后变得饱和,增加变慢,最后达到成熟时基本停止增长。新冠病毒感染人的发展趋势也具有类似特点。3.1 模型建立
Logistic函数是一种常见的S型曲线函数式[5]。如式(1)所示,本文拟利用Logistic函数建立美国新冠病毒感染人的发展趋势模型。
PP(tt)=KKPP0ee rrrr
KK+PP0(ee rrrr−1)              (1)
2021年福建电脑49
其中:t表示时间,P0表示初始确诊人数,K 表示疫情峰值,即疫情最高峰累计确诊人数,r表示增长率。在传统Logistic函数曲线中,r值可以衡量曲线变化的快慢。针对新冠疫情,该函数曲线中的r值表
示疫情到达峰值的速度。如果r值较大,疫情将很快到达峰值,表示一个国家在疫情期间采取强力有效的措施,比如医院收治迅速、集中隔离等;反之,疫情到达峰值的时间较长。因此,r值的大小可以衡量一个国家面对疫情采取措施的效率,社会面对疫情的整体能力,众面对疫情的态度。将Logistic函数曲线和334天的实际数据拟合曲线进行对比,如图4所示。
图4  Logistic曲线拟合预测图
从图4中可以看出,两条曲线具有较好的重合趋势。利用最小二乘法进行检验计算,结合公式(1),得到参数P0、K、r的值分别为303150939、459377、0.011,以此参数代入式(1),即可作为美国新冠肺炎确诊人数的预测模型,见式(2)。
PP(tt)=303150939×459377ee0.011rr
303150939+459377(ee0.011rr−1)(2) 3.2 计算结果分析
图5  累计确诊人数预测图
从图4中可以看出,Logistic函数曲线和实际数据拟合曲线整体趋势相同,因此新冠肺炎疫情发展趋势还在增长中,远未达到疫情拐点。在疫情开始三个月后,也就是疫情爆发之后,两条曲线重合度增加,说明疫情的传播速度非常符合Logistic曲线的趋势,完全可以用其进行预测。
将时间从334天延长到600天,利用预测模型(2)进行计算,预测结果如图5所示。可以看出,按照美国目前采取的疫情预防措施,大约在2021年12月达到疫情拐点,疫情趋于平稳,最终累计确诊人数大约1.8亿人左右。
4 结论与讨论
本文利用Logistic函数建立了美国新冠肺炎感染确诊者人数的预测模型,通过最小二乘法与实际数据拟合曲线进行检验,二者误差较小,说明本文建立的Logistic预测模型是可行的。依据该模型预测结果,美国新冠肺炎确诊人数将在2021年12月达到高峰,之后逐渐下降。因此可以利用Logistic 预测模型对新冠肺炎疫情整体趋势做出判断。
美国疫情迟迟得不到控制与美国特朗普政府的政策以及美国人民对待疫情的态度有着莫大的关系。特朗普政府对新冠疫情的轻视使政府未能做出有效的防疫措施;美国人民众示威游行,不戴口罩出行,自由大于生命的态度,导致新冠肺炎疫情传播的加速和确诊人数的急剧增加,严重的疫情丝毫不能改变他们刻在骨子里的“自由”思想。美国疫情的不断加剧可以说是一种必然。冬季来临,寒冷的天气利于病毒的传播,为了防止新一轮的暴发,希望美国政府应当尽快制定有效的防疫措施及政策,美国人民也应端正对待疫情的态度。否则,疫情的结束将遥遥无期。同时,我国大部分地区疫情虽已经结束,但是冬季来临,建议国家采取更加严格的防范措施和政策,尤其是加强对外来人员的检测,确保新冠肺炎疫情在我国不再蔓延和流行。
参考文献
[1] 王旭艳,喻勇,胡樱,宇传华.基于指数平滑模型的湖北省新冠肺炎疫情
预测分析.公共卫生与预防医学,2020,31(01):1-4
河北新一轮疫情[2] 盛华雄,吴琳,肖长亮.新冠肺炎疫情传播建模分析与预测.系统仿真学
报,2020,32(05):759-766
[3] 曹盛力,冯沛华,时朋朋.修正SEIR传染病动力学模型应用于湖北省
2019冠状病毒病(COVID-19)疫情预测和评估.浙江大学学报(医学
版),2020,49(02):178-184
[4] Dong E, Du H, Gardner L. An interactive web-based dashboard to track
COVID-19 in real time. Lancet Inf Dis,2020 20(5):533-534
[5] 赵红. Logistic曲线参数估计方法及应用研究[硕士学位论文].吉林农
业大学,长春,2015