您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾景数研]:腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测 - 发现报告
当前位置:首页/宏观策略/报告详情/

腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测

2022-12-16吴卫、赵宕涵腾景数研北***
腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值——基于腾景AI高频模拟和预测

请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日大数据疫情观察:中心城市率先迎来峰值一、人们尚未完全摆脱对奥密克戎的“恐惧”•2022年11月经济数据表现低于预期,工业增加值、服务业生产指数、社会消费品零售总额、固定资产投资额相继走低,这也和腾景AI高频预测(模拟)的方向一致,但我们的模型还是低估了本次疫情对经济的冲击。钟南山院士从这些年防疫经验总结以及科学模型的研判,预计明年三月中上旬,国内疫情进入相对平稳阶段。•结合日本、越南等国家放开后的发展路径,社会大众在放开初期可能会有一定的“恐慌”情绪,这一情况在国内有所显现。但是我们看到,疫情放开之后,亚洲地区如日本、越南、中国台湾经济增速有明显改善,人们最终克服了“恐惧”。最终每个国家都要经历一个阵痛期,好在病毒的致病性、致死率在下降。展望未来,我们的经济复苏进程取决于抗疫的背水一战如何收场?目前没有退路,长期非常态化的经济社会秩序和疫情管控措施,其实也是有代价的,而且代价可能更大。只有尽可能地为有基础病的老人、儿童等弱势群体准备好“救生衣”趟过这股洪流,克服“恐惧”,战胜“恐惧”本身,才能赢得最后的胜利。本期要点:相关报告《腾景宏观快报:美国11月CPI同比继续加速回落,或为7.3%》2022-12-03《腾景宏观快报:类通缩状态下,大规模消费刺激或将成为2023年实现5%左右潜在增长水平的关键》2022-11-29《腾景宏观快报:利用美国电价修正美国CPI高频模拟误差》2022-11-18010-65185898 | +86 15210925572IR@TJRESEARCH.CNhttp://www.tjresearch.cn北京市朝阳区朝阳门外大街乙6号朝外SOHO-A座29层联系我们——基于腾景AI高频模拟和预测腾景宏观快报腾景高频和宏观研究团队第1页 | 共20页 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第2页 | 共20页•虽然有“二十条”到“新十条”的逐渐放开,但是发烧、咳嗽人数直线上升,打开微信朋友圈、抖音,从微观感知上,似乎疫情已经迅速登顶。但作者团队所在的北京,也是目前国内疫情扩散最严重的城市之一,从新增疫情确诊人数统计来看并没有快速上升,微观上的寒冷与宏观上的滞后促成了我们使用大数据来研判疫情感染曲线的“偏度”和“峰度”。图:2022年11月腾景AI经济预测高频预测结果数据来源:腾景宏观高频模拟和预测库图:2022年12月15日经济数据公布后,各机构(包括腾景AI经济预测)的准确率数据来源:Wind、腾景宏观高频模拟和预测库注:黄色为机构/研究员之间的数值精度评比,紫色为腾景AI与市场预期的数值精度评比 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第3页 | 共20页二、互联网搜索指数•从微观感知上,互联网搜索指数刻画了所有接入互联网的疫情参与程度,除了无症状感染者之外,绝大多数的阳性患者在病程初期会出现发烧,病程后期会出现咳嗽等症状。我们通过互联网搜索平台对“发烧”、“咳嗽”、“咽喉痛”的搜索来验证疫情是否达到顶峰。•使用互联网搜索指数预测流感或者新冠疫情的发病情况其实不乏先例。Shuhui Guo, Fan Fang等(2021)使用微博帖子改进谷歌流感趋势对COVID-19的估计。Ma, S., Yang, S.(2022)在美国使用互联网搜索信息进行COVID-19预测,预测结果发表在美国《自然》杂志。图:Google Trends 领先香港新增确诊一周数据来源:Google Trends、国家卫健委图:头条关键词“发烧”于2022年12月13日见顶数据来源:巨量算数 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第4页 | 共20页图:百度搜索指数“发烧”于2022年12月12日见顶数据来源:百度搜索指数图:互联网搜索与城市人口感染逻辑关系三、前期研究:基于SIR和SEIR模型1、SIR模型•SIR模型是一种经典的传染病模型,用于预测传染病传播的情况。它基于人口统计学的原理,将总人口分为三个状态:易感者(S)、感染者(I)和康复者(R)。该模型假设人们之间的联系是随机的,并用数学方程来描述传染病的传播。•SIR模型有助于预测传染病的流行情况,从而帮助政府和公共卫生机构制定有效的防控措施。它还可以帮助评估不同控制措施的效果,为决策提供参考。不过,SIR模型也有一定的局限性,例如忽略了人口之间的社会关系和行为因素等。因此,在使用SIR模型时,应该结合其他信息和工具,进行综合分析和评估。•兰州大学新冠肺炎疫情全球预测系统是世界首个全球疫情预测系统,由兰州大学西部生态安全协同创新中心主任黄建平及其团队研发,于2020年5月25日首次发布。该系统基于SIR模型的方法进行疫情预测。COVID-19大流行全球预测系统(GPCP)的第二版使用了更复杂的SEIR模型。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第5页 | 共20页•该预测模型是一个结合了全球真实流行病数据、气象因素和隔离措施的改良流行病SIR模型。假定在暴发期间不同地区的总人口保持不变;COVID-19只是通过人与人之间的传染扩散;个体之间没有免疫力差异。每个国家的总人口被分成三种类型:易感人群S,感染人群I,治愈和死亡人群R。SIR感染疾病模型使用以下方程描述:•其中r是和感染人群接触的人数;β是感染率;μ是退出率。•基于上面定义的经典SIR模型,兰大的预测团队发展了一个包含温度、湿度、城市人口密度和对COVID-19感染的控制强度的新模型。模型定义如下:•该团队发现环境温度和大气中NO(2)含量是预测新冠疫情的两个重要指标。新冠疫情传播的最佳温度是5-15°C,全球70%新冠肺炎确诊病例出现在气温5°C-15°C之间(见前期研究成果)。另外,利用卫星观测的NO(2)含量能很好的反映各国政府防控和限制措施的实施效果。大气中NO(2)含量反映了汽车尾气和工业排放情况,当NO(2)显著减少时,说明交通量大量放缓,人际交流显著减少,14天后疫情会显著减少(见前期研究成果)。•为了引入温度,湿度和政府管控措施,作者假定:•其中F(1)(T(2m))和F(2)(RH(2m))分别是局地温度,相对湿度与每日新增确诊人数的函数关系;NO(2)是局地NO(2)浓度的变化率,反映了隔离措施的强度。严格的隔离措施有助于增加社交距离和减少感染概率。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第6页 | 共20页2、改进后的SEIR模型•SEIR模型是SIR模型的扩展,用于更精细地描述传染病的传播情况。这种动态模型允许人员在称为间隔的组之间移动,并且每个间隔依次影响另一个间隔。•SEIR模型定义了六种人群:易感者(S),不易感者(P),潜在感染者(E,处在潜伏期的感染者),传染者(I,尚未隔离的感染者),隔离者(Q,已确诊且已被隔离的感染者),康复者和死亡者(R)。这六种人群的总和始终等于总人口(N)。该模型基于以下假设:•1、总人口应始终等于易感人群(S)、暴露人群(E)、保护人群(P)、感染人群(I)、隔离人群(Q)、死亡人群(D)和康复人群(R)的人口之和;•2、各地区总人口不变;•3、新冠仅通过人与人之间传播;•4、所有人具有相同的免疫力。•该模型由以下6个方程式组成:•在第二个版本的模型中,作者考虑了社区解封时间。以解封当天的新增病例数 (dQc) 做为标志,当某日的新增确诊病例数低于dQc时,地方政府可以开始解除封锁。模型中社区解封时间和市民自我隔离等因素的考虑,使得预测更加准确。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第7页 | 共20页图:北京“发烧”搜索指数数据来源:百度搜索指数、腾景测算四、哪些城市可能已经达到峰值•传染病的传播有两类反馈机制:第一类是正反馈机制,可以由病毒的传染指数和社会的防疫程度共同决定,“新10条”之后可以看到各地的“发烧”指数陆续上升,北京上升峰值是历年平均的十倍左右,保定上升峰值在6倍左右,这一数据在“巨量算数”里更高。由于搜索指数和微观感知较为一致,我们以北京、保定达峰为锚定,预估各地方感染达峰时间点。第二类是负反馈机制,因疫情高发,居民主动减少出行、社交等接触性活动,这会在一定程度上降低疫情蔓延,压平疫情传染曲线的峰值。注:按照历年均值为100处理。下同。•各中心城市除北京外,基本上搜索指数处于上行态势,值得注意的是,石家庄市在12月份高其他所有城市一截,说明其放开程度领先于全国其他城市,这与我们新闻上的感知一致。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第8页 | 共20页图:国内部分城市“发烧”搜索指数数据来源:百度搜索指数、腾景测算图:河北省“发烧”搜索指数,保定可能已经见顶数据来源:百度搜索指数、腾景测算•基于“发烧”搜索指数,我们可以观察全国各地的感染强度,“发烧”的搜索量相较于历年均值的差异(归一化)。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第9页 | 共20页各省市近期感染强度数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第10页 | 共20页全国“发烧”搜索指数安徽“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算注:颜色越红,进程越快。省内城市在同一张图可以比较,跨省城市颜色不可比。数据以2022年12月1日~12月14日百度指数的平均值测算。 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第11页 | 共20页福建“发烧”搜索指数广东“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第12页 | 共20页广西“发烧”搜索指数河北“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第13页 | 共20页河南“发烧”搜索指数湖北“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第14页 | 共20页湖南“发烧”搜索指数江苏“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第15页 | 共20页山东“发烧”搜索指数山西“发烧”搜索指数数据来源:百度搜索指数、腾景测算数据来源:百度搜索指数、腾景测算 请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月16日第16页 | 共20页浙江“发烧”搜索指数数据来源:百度搜索指数、腾景测算五、未来疫情走势分析搜索本身行为属于流量,对应新增确诊人数大致没有问题。但是不同城市人与人的互动关系并不一致,大城市人与人在经济上的互动更为频繁,地铁等通勤工具加速了病毒的传播。这里需要引入3个假设:•1、首先定义当前每日发烧搜索量/历年均值,代表每日新增疫情强度;•2、城市的人与人交互的频率类似;•3、在单日新增高点未到来之前,大致呈单调递增,当前进程同样重要。分短期、中长期