论文部分内容阅读
背景:流行性感冒(influenza),简称流感,是由流感病毒引起人类和其他动物的一种急性呼吸道传染病。流感传播迅速而且波及范围广泛,临床上起病急,主要症状表现为高热、头痛、全身肌肉酸痛及乏力等症状,重症病例可出现多种并发症,包括继发细菌性肺炎、病毒性肺炎、呼吸窘迫综合征、弥漫性血管内凝血以及休克等肺外症状。人类对流感病毒普遍易感,尤其青少年、老年人以及免疫力低下人群更容易感染。全球每年季节性流感高达10亿例,其中约有300万-500万例重症病例和高达65万例呼吸道感染相关死亡。中国是流感感染高负担国家,基于人口的流感病毒呼吸道感染死亡研究表明,我国平均每年发生88000例流感死亡,约占全球流感死亡人数的13.6%。本研究工作开展期间,正值全球范围内面临继严重急性呼吸综合征(Severe acute respiratory syndrome coronavirus,SARS)以来形势最严峻、感染传播最广泛的新发呼吸道传染疫情—新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)。截至目前,新冠肺炎疫情“全球大流行”已蔓延至200多个国家和地区。根据世界卫生组织数据显示,截至3月30日24时,全球新冠肺炎累计确诊超4.6亿,深刻影响着全球人类社会的生产和生活。流感病毒感染季节关联性强且危害性较大,在新发新冠肺炎流行的背景之下,季节性流感的流行趋势及风险将会如何走向是呼吸道传染病领域内的又一新的命题。目的:本研究旨在通过流行病学调查和病原监测,分析广东地区在新冠病毒流行期间流感病毒感染的流行特征和变化规律;探究新冠流行期间广东地区流感病毒HA、NA和PA基因遗传进化情况;同时采用流感阳性病例监测数据、天气气候数据和流感病毒基因进化指数等多源参数,融合人工智能学习算法构建新冠流行背景下流感流行趋势的预测模型。从而为我国在新发传染病背景下应对和制定流感的精准控制策略等方面提供有效的科学依据。方法:(一)基于国家呼吸系统疾病临床医学研究中心临床呼吸道病毒监测网的呼吸道病毒监测数据及信息,采用描述性流行病学统计方法分析和总结了广东地区2018-2021年期间流感流行病学及其流行特征。(二)选取广东地区2019-2020年流感季期间流感病毒核酸阳性临床呼吸道样本,提取流感病毒样本RNA核酸,利用特异性扩增引物对三种型别的流感毒株的HA、NA和PA基因进行逆转录PCR扩增,提取和纯化扩增产物,然后进行HA、NA和PA基因序列全长测序,与选择的疫苗株、参考病毒株的HA、NA和PA基因序列进行比对分析。基因序列拼接软件采用Tracy软件,使用blast软件进行序列同源性分析,使用Muscle软件进行多序列比对,然后使用IQ-TREE软件构建系统发育进化树,用Data Monkey软件进行选择压力分析。(三)利用广东省地区流感阳性病例样本发生的时间序列、国家呼吸系统疾病临床医学研究中心临床呼吸道病毒监测网的流感阳性病例监测数据、天气及气候数据、流感病毒基因遗传进化指数和口罩使用情况等多源数据,在经典的SIRS流行病学模型基础上,融合时间序列模型、非线性拟合模型及神经网络学习算法等构建新的流感预测模型。采用广东省区域2018年1月至2019年7月期间每1000人中的活跃流感感染人数对构建的SIRSNet预测模型进行训练,用2019年9月至2020年1月的流感感染疫情拟合曲线,并用真实数据对拟合曲线进行了验证,检验模型的预测效果。结果:1.广东地区2018-2021年流感流行特征研究新冠肺炎流行前广东地区流感病毒感染呈明显的季节变化,流感流行可以发生在冬春季节,也可能发生在夏季。在2018-2019年期间,南方地区流感样病例在春季和冬季活动趋势较为活跃。而在2020-2021年流感季,正处于突发新型冠状病毒冠肺炎疫情期间,整体流感病毒的流行处于较低水平。易感人群分析显示,广东地区流感波及的主要群体是5-14岁、15-49岁和50-64岁的人群,此三个年龄组的病例数占病例总数的70%以上。其中甲型流感病毒在2018-2020年期间易感人群有差异,三年间每年的易感人群分别为5-14岁、50-64岁、15-49岁,这可能与不同年度间流行的甲型流感病毒亚型的不同有关。乙型流感病毒在三年间的易感人群未发生明显变化,均为15-49岁的群体。从总体来看,流感病毒的阳性率在15-49岁的年龄群体中的比例在逐年升高。2018-2021年期间广东地区每年各亚型流感病毒构成不断发生变化,每年流行的优势毒株也不相同。与前三年相比,2021年期间流感病毒在各年龄段人群中的检出率均偏低,在新冠流行前的2018年和2019年,15-49岁年龄人群的甲型和乙型流感病毒阳性检出率均高于12%;2020年期间,各年龄段人群乙型流感病毒的阳性检出率虽低于3%,但2021年以来乙型流感的阳性率又呈现出逐渐回升的趋势。综合来看,甲型流感病毒是引起广东地区流感流行的主要病原,新冠流行期间甲型H3N2亚型、甲型H1N1亚型、乙型Victoria系流感病毒是主要的流行毒株。2.流感病毒在新冠流行期间的遗传进化分析研究新冠流行期间,甲型H3N2亚型流感病毒的HA基因发生了多个抗原表位突变,并且呈现出多样的抗原变异模式。其中HA蛋白的第202位(氨基酸由G变成D)和第206位(氨基酸D变成N)的突变为新出现的突变。NA蛋白的第344位突变(氨基酸由E变为K),占所有样本突变比例的85.71%;PA蛋白第626位(氨基酸由K变为R)和第321位(氨基酸由Y变为C)的突变在样本数中占比为67.86%。与WHO推荐的流感病毒疫苗株相比,新冠流行期间甲型H3N2亚型流感病毒均有发生第144位(氨基酸分别由K变成S)、第159位(氨基酸分别由S变成Y)、第121位(氨基酸分别由N变成K)、第62位(氨基酸由E变成G)的抗原突变。甲型H1N1流感病毒的HA基因普遍发生的基因突变位点有G204A,Q206E,V267A等。与WHO推荐的流感病毒疫苗株相比,广东地区新冠流行期间的甲型H1N1流感病毒发生的抗原表位的突变主要集中在91,180,181,202和200位点。乙型流感病毒HA的基因序列普遍产生了G148R,R151E,NDKN178N突变;与WHO推荐的流感病毒疫苗株相比,新冠流行期间乙型流感病毒发生的抗原表位的突变主要集中在HA基因120-loop区域的144位点发生G144D突变,148位点发生G148R突变,151位点发生K151E突变。基因进化选择压力分析表明,新冠流行期间广东地区流感病毒的HA,NA和PA基因均受到纯化选择压力,进化的动力为自身适应性改变;同时HA和NA基因的选择压力大于PA基因,甲型H1N1亚型和乙型流感病毒的的HA基因也存在部分正向选择位点。耐药突变分析显示未有发现流感病毒株在神经氨酸酶抑制剂主要耐药位点(119E、136Q、151D、198D、222I、224R、274H、276E、292R、294N 371R)产生耐药突变,表明新冠流行期间广东地区流感病毒均未对神经氨酸酶抑制剂产生普遍耐药性。3.新冠流行背景下的流感流行趋势预测研究通过构建的SIRSNet流感预测模型,模拟出广东地区的流感流行趋势:假设2019年12月到2020年2月期间在没有突发COVID-19疫情,甲型流感的暴发高峰在2020年2月和3月份,期间每1000人中将会有8例活跃流感感染病例;但实际情况是每1000人中仅有2.45例活跃感染病例,且在实施应对VOVID-19疫情的干预措施下,并未发生甲型流感的流行。假定在不戴口罩的情况下,广东省地区的甲型流感活动性感染数量将会从2020年12月16日开始增加,并在2021年1月达到峰值,高峰时每1000人中将达到15.86例活跃流感感染病例。假若全广东省区域范围内仅有10%的人口(约1300万人)佩戴口罩,发生的流感活跃感染病例数则仅次于峰值时的活跃病例数,每1000人中活动性流感感染病例达15例,根据人口总数测算将会导致6501300例流感暴发;如果有50%的人口(约6500万人)佩戴口罩,每1000人中的流感活跃感染人数将显著降至5.64人,根据人口总数测算会发生2602600例流感暴发,即低于疫情高峰时期感染人数的一半;假设达到90%的总人口(约1.17亿人)佩戴口罩的状态下,模拟出的流感感染病例则会大大降低至785200例。通过预测模型建立的“带口罩”指数表明,在首次出现疫情时口罩使用率越高,则后续疫情发展的有效再生数Rt值也下降越快;而且口罩的使用率越高,Rt值的峰值则越低,这对于减少发生流感疫情时感染人口的基数至关重要。结论:1.2018-2021年期间广东地区不同亚型流感病毒流行规律不同,优势病毒株也在不断变化。新冠流行期间甲流H3N2亚型、甲流H1N1亚型、乙型Victoria系流感病毒是主要的流行毒株。2.新冠流行期间广东地区流感病毒的基因正在快速进化,病毒的HA基因发生了多个抗原表位突变且呈现出多样的抗原变异模式;与WHO推荐的流感病毒疫苗株相比,发生抗原簇位点的基因突变可能会导致疫苗保护作用的下降,从而引发流感的流行。3.新冠流行期间广东地区流感病毒的HA,NA和PA基因均受到纯化选择压力,进化的动力为自身适应性改变;流行病毒株基因的神经氨酸酶抑制剂耐药位点未发生突变,病毒未对神经氨酸酶抑制剂产生普遍的耐药性。4.构建了基于多源数据融入人工智能算法的新流感预测模型,通过预测模型建立了“戴口罩”指数;佩戴口罩能有效降低疫情发展的有效再生数R(t)值,对未来潜在的流感疫情发展趋势有极其重要的影响。