中国兽医协会兽医实验室检测分会 【摘要】宏基因组高通量测序技术作为一项新兴的、通用的微生物检测工具,可以识别所有微生物,在动物病原微生物临床检测中发挥了重要作用,被广泛应用于动物多病原检测、未知病原诊断、疫病流行病学调查、病原溯源等多种场景。但在兽医检测行业,宏基因组高通量测序技术尚未形成一致性、规范性认识。本文从实验室建设及管理、实验操作、生物信息学分析、结果判定、质量控制、报告审核等方面阐述了宏基因组高通量测序技术在动物病原微生物临床检测中应用的专家共识,并提出规范性要求和建议。 【关键词】宏基因组高通量测序技术;动物病原微生物;专家共识 过去几十年来,禽流感、非洲猪瘟、口蹄疫等动物传染病给畜牧业造成了重大损失,同时动物来源的传染病病原体对食品安全和公共卫生健康构成了严重的威胁。据世界卫生组织报告,全球新发传染病中约有60%的传染病和75%的新兴人类病原体来自动物。有效监测、控制动物病原微生物的发生对维护人类、动物和生态系统“同一个健康” 至关重要。微生物高通量测序(High-throughput Sequencing, HTS)方法主要包括全基因组测序、宏基因组测序、靶向测序。其中,宏基因组高通量测序技术不依赖于传统的微生物培养,无需特异性扩增,直接对临床样品中的核酸进行高通量测序,通过与数据库进行比对分析,根据比对到的序列信息来判断样品包含的病原微生物种类,能够快速、客观地检测临床样品中的所有微生物[1]。宏基因组高通量测序技术可用于动物及动物产品(动物源性食品、疫苗、饲料、生物材料、培养物或分离物等)中的微生物(包括病毒、细菌、真菌、寄生虫、放线菌、衣原体、支原体、立克次体、螺旋体)测序,适用于二代和三代高通量测序平台[2]。 世界动物卫生组织(World Organization for Animal Health,WOAH)陆生动物诊断测试和疫苗手册推荐了高通量测序技术在动物病原微生物检测上的应用场景及检测目的:(1)可用于检测生物材料(如诊断或监测样品)、培养物或分离物中的感染因子及其特征;(2)也可以作为一种确诊方法,确认在其他初筛中检测到的生物,或提供其他特征分析;(3)检测、鉴别此前从未鉴定过的微生物,并进行特征分析;(4)提高已知疫病的诊断水平;(5)提高由已知或未知病原造成的新发或再发疫病的诊断水平;(6)开发单一的“通用”诊断技术,鉴定任何潜在病原体;(7)对于多因子混合感染的疫病,同时快速检测多种病原体;(8)在农场、地方、国家和全球等层面,提高研究病原体进化动力学的能力;(9)更深入地了解传染病的流行病学和感染因子的亲缘地理学;(10)加强传染病和病原体传播模式的可追溯性,包括在法医流行病学中的应用;(11) 更全面地了解已知病原“群体”(如相关次要流行株、逃逸变异株等)的特性,有助于开发更好的疫苗、抗病毒制剂等;(12)通过对一个病原体的多个毒/菌株(包括参考株)进行全基因组测序,更好地建立起病原基因型和表型之间的关联。 现在我国尚未出台动物病原微生物宏基因组高通量测序技术应用的规范性标准,国内部分兽医实验室建立了各自的宏基因组高通量测序平台,但还没有形成行业内规范性、系统性、一致性的认知。为了满足兽医临床测序需要,本共识将对如何开展动物病原微生物宏基因组高通量测序提出具体的指导性意见。 1实验室建设基本要求 1.1生物安全要求 宏基因组高通量测序的动物种类和病原微生物种类范围广泛,可能存在高致病性病原微生物,开展动物病原微生物宏基因组高通量测序的实验室应具备生物安全二级(biosafety level 2,BSL- 2)及以上的条件和相关资质,并严格按照农业农村部要求及相关法律法规进行实验操作[3-9]。 1.2实验室结构布局 宏基因组高通量测序整个流程通常分为湿实验和干实验两部分[10]。湿实验流程是指从样品处理到测序数据产生的整个过程,需要在标准的实验室完成,一般包括:样品前处理、核酸提取、文库制备、测序;干实验流程是指对测序数据进行生物信息学分析及结果审核和出具报告的过程。宏基因组高通量测序湿实验的每一个环节都要严格控制气溶胶污染。实验室具备的基本功能区域应包括:体系配制室、样品处理室、核 酸提取室、文库制备室、测序室,各实验室应配备能满足实验需求和质量控制要求的实验设备,人员、试剂和耗材应单向流动。 1.3人员配置 实验室要求相关工作人员必须具有相应专业背景和专业技能,包括:湿实验要求实验人员应具备分子生物学和微生物学专业技能,保证实验规范性操作;数据信息分析人员应具备生物信息学专业技能;结果和报告审核人员应具备动物医学专业背景和兽医临床经验。所有人员均须通过岗位相关的培训和考核方能上岗[3,7-9]。 1.4测序平台 高通量测序技术包括第二代测序技术(next generation sequencingtechnique,NGS)和第三代测序技术(third generation sequencing technique,TGS)。NGS以DNA纳米球测序和边合成边测序技术为主,测序数据量大,准确性高,测序成本低,但测序读长较短,拼接复杂、长基因组时较困难;TGS以纳米孔测序和单分子荧光信号测序两种技术为主,测序读长长,可拼接长基因组序列,但数据产出量较低,准确性较低、测序成本较高,可实时产出数据,设备可便携[2]。各实验室可根据自身测序样品数量、测序长度、准确度、数据量、时效性和测序成本等因素选择适合的测序方法和测序平台。 2实验操作 2.1样品采集及制备 样品质量和适用性直接影响动物疫病的宏基因组高通量测序实验结果[3]。因此,样品采集应尽量选择感染部位的体液或新鲜组织,以提高 测序的灵敏度。采集过程中应执行无菌操作,避免样品被污染。样品采集过程中应使用无菌采样管、采样袋等无菌采样,每个样品须单独保存,在包装外标记清楚样品编号、样品名称、物种来源、采样日期、采样地点、送检人名称及联系方式、送检单位、病例信息及测序目的等信息[3]。 样品采集后应以最快最直接的方式送往实验室,运输过程中需使用低温容器,以免发生核酸降解,并防止样品泄漏和污染。若无法及时送检,应按规定条件进行保存。 在动物疫病领域,样品类型复杂,不同样品类型需要采用不同的前 处理方式和核酸提取方法。样品制备时应遵守从洁净到非洁净、从简单到复杂的规则,优先制备全血、组织等相对洁净的样品,再制备口鼻拭子、粪便等非洁净的样品。 2.2核酸提取 提取样品核酸时,可选用自动化提取或者手动提取。根据测序目的和建库要求,提取方法可选用DNA提取、RNA提取或者DNA和RNA共提取。宏基因组高通量测序样品类型复杂,对文库核酸的纯度和浓度要求高,且细菌、真菌、寄生虫、支原体等微生物提取难度大,建议使用经过验证可用于宏基因组高通量测序的核酸提取试剂[10]。核酸质量应符合建库要求。 2.3文库制备 文库制备是指将基因组DNA通过打断、连接测序接头等方式形成适用于测序仪器读取的形式。根据测序目的和样品类型选择合适的测序平台和建库方法,文库制备方法可分别选用DNA文库制备、RNA文库制备、DNA和RNA共建库。实验室在建库过程中需要对核心技术环节质量进行评估,包括核酸的投入量、单/双标签、片段大小、文库的浓度和纯度等,确认文库质量符合仪器测序模式和数据质量要求[2,5,10]。 2.4上机测序 测序仪与配套试剂、耗材通常为封闭一体化设计,实验室按照选用的测序仪器说明书进行操作,并根据不同型号仪器对文库进行前处理。测序完成后,需确认碱基识别质量、N50、文库有效数据量、数据拆分率等数值符合测序要求。 3生物信息学分析 生物信息分析是对测到的原始序列进行数据分析和处理,最终将测序数据转化为服务于临床兽医和生产人员的病原微生物报告的过程。 3.1数据库 中国目前尚无专门用于动物病原微生物宏基因组高通量测序数据生物 信 息 学 分 析 的 标 准 数 据 库 , 国 内 各 测 序 实 验 室 通 常 使 用NCBIGeneBank、NCBI RefSeq、国家微生物科学数据中心发布的gcPathogen等公共数据库,但任何一个公共数据库都不能包含所有微生物基因组信息,且数据库中不可避免地存在一些注释错误或污染的序列导致的假阳性和新发病原体或病原发生变异导致的假阴性[10]。建议动物病原微生物宏基因组高通量测序实验室在公共数据库的基础上自建或使用商品化动物病原微生物数据库,该数据库应包含公共数据库信息、特定病原基因组信息,以及临床流行毒株基因组信息。需要对动物病原微生物数据库进行定期更新、维护,及时补充微生物不同亚型或亚种以及新发病原体的基因组信息,提高数据比对的准确性和全面性[10]。 实验室应建立专用的动物宿主数据库,该数据库应包含测序相关的宿主基因组信息,并定期更新、维护,及时补充测序所需宿主基因组的数据。 实验室需配备专用的高性能服务器,该服务器应可集成分析流程和数据库,对下机数据进行分析处理。 3.2数据分析 3.2.1数据预处理 测序的原始数据是指样品测序获得的没有经过任何处理的全部测序数据,包括宿主序列、病原微生物序列、接头序列、标签序列,以FASTQ格式储存。原始数据去除接头序列、标签序列后得到的可用于比对的序列称为可用数据或纯净数据。数据过滤指标建议:保留的有效读长序列不小于50 bp;二代高通量测序数据用Q30作为阈值去除低质量序列,三代高通量测序数据用Q7作为阈值去除低质量序列;应完全去除接头序列和重复序列。常用软件有Trimmomatic、fastp、NanoPlot等[11,12]。 3.2.2去宿主 为了避免残留的宿主核酸对后续动物病原微生物分析产生影响,在动物病原微生物测序数据分析时,应根据宿主信息,去除测序数据中的宿主基因组数据。常用软件有BWA、Bowtie2、Minimap2等[11,12]。 3.2.3物种鉴定 动物病原微生物宏基因组高通量测序实验室应建立完善的动物病原微生物生物信息学分析流程,包括序列比对、物种鉴定等。微生物种类鉴定应至少鉴定到具体微生物种属。常用软件有:Kraken2、Centrifuge、BLAST等[11,12]。 3.2.4致病微生物识别 宏基因组高通量测序结果中可能含有多种微生物信息,例如正常菌群、环境微生物和污染微生物。在动物病原微生物宏基因组高通量测序中,应结合临床症状对致病性微生物进行识别。建议建立动物致病病原微生物数据库,用于动物病原微生物宏基因组高通量测序报告的判定指导,排除非病原微生物对结果判读的影响。 4结果判定 宏基因组高通量测序获得的微生物序列数(Reads)受测序样品量、样品质量、下机数据量等因素影响,每个样品测序获得的微生物序列数不一致。因此宏基因组高通量测序结果判定时,建议将测序获得的微生物序列数进行归一化,以每百万条序列数(Reads per million,RPM)或每千万条序列数(Reads per ten million,RPTM)为单位。各实验室应以归一化后的微生物序列数、物种覆盖度或相对丰度为基础,结合阴性对照、测序样品信息(样品类型、采样部位、是否污染)和临床症状表现制定相应的结果判定标准。建议阈值为检出3条微生物序列数,且能覆盖3个非重复区域。 5质量控制 5.1数据质量控制 5.1.1文库质量控制 实验室应根据测序目的、测序方法、测序长度等因素选择合适的建库试剂。每批文库都应进行质量评估,插入片段大小、单个文库浓度、混合文库浓度等指标符合测序仪上机要求后才能再进行下一步测序。 5.1.2测序数据质量控制 动物病原微生物宏基因组高通量测序数据,建议二代测序碱基识别质 量Q30≥90%, 每 个 样 品 的 序 列 数≥10 M(10 million); 三 代 测 序Q10≥80%,每个样品的数据量≥1Gb(1 Gbase)。 5.1.3性能验证 宏基因组高通量测序需要通过质控品和临床样品对全流程的湿实验 和干实验进