应用Illumina Miseq测序分析饮用水源水中病毒多样性

葛英亮1,2,于水利2,3,*,时文歆2,*

(1.哈尔滨学院食品工程学院,黑龙江 哈尔滨 150080;2.哈尔滨工业大学市政环境工程学院,黑龙江 哈尔滨 150090;3.同济大学环境科学与工程学院,上海 200092)

摘 要:以东太湖水源水为研究对象,应用梯度-串联-循环-切向流超滤技术对水体中病毒进行分离浓缩,使用非序列依赖性单引物扩增技术扩增源水中病毒基因组,采用Illumina Miseq进行测序,与NCBI基因数据库进行比对,质控后获得1 190 914 928 bp基因数据,可组装成5 554 条scaffolds序列,获知病毒基因组功能,经比对可注释到尾噬菌体目(Caudovirales)、疱疹病毒目(Herpesvirales)、线状病毒目(Ligamenvirales),在科的水平上,注释到40 个科病毒的同源序列,其中含量较高的病毒科为Microviridae占27.590 1%,Siphoviridae占23.010 7%,Phycodnaviridae占5.322 2%,Retroviridae占1.691 2%,Mimiviridae占1.960 8%,其中无法注释(norank)占21.572 8%,102 112 条reads在科水平上norank,研究可以高通量的获得水源水中病毒多样性信息,并为水体中病毒的检测提供理论参考依据。

关键词:Illumina Miseq测序;饮用水源水;病毒;多样性

病毒是一种没有细胞结构的特殊生物体,几乎可以感染所有具有细胞结构的生命体(动物、植物、微生物等)[1-2]。病毒不仅存在于宿主细胞及生物体内,且可独立存在于生态环境中[3]。水体是病毒可长期存活的环境之一,也是病毒传播的主要介质之一,水体中病毒分析一直以来都是水体微生物中最具挑战性的研究。自20世纪50年代以来,人们越来越关注水体中病毒对人类健康的危害[4]。有研究发现,部分病毒在自然水体中存活时间很长。在水体病毒实验室检测中,采用配制水研究病毒在水体中存活的状态,不够合理,也不能有效说明自然水体中病毒的组成和丰度[5-7]。病毒个体小、变异速度快,且不具有类似细菌、真菌等微生物的保守系统发育序列,难以采用常规的分子生物学检测手段进行分类评估,不能同细菌、真菌等微生物群体一样采用16S rDNA、18S rDNA及ITS保守序列进行多样性分析[8],因而,病毒多样性研究一直是微生物生态学研究的难点[9-10]。目前,已有研究方法效率低,准确率不高。由于饮用水生产过程中病毒的检测难以进行,仅有美国和加拿大等几个发达国家在饮用水标准中有极少的与病毒相关的要求和指标[11],且病毒对饮用水消毒中常用消毒剂抗性强于细菌,具有一定的泄露风险,因此,应当增加水体中病毒多态性的分析和检测领域的研究[12-13]

出厂水中可能存在病毒的种类和丰度可能取决于源水中病毒的多态性和丰度,本研究采用梯度-串联-循环-切向流超滤(gradient-series connection-circulation-tangential flow ultrafiltration,GSC-TFF)技术可有效分离浓缩水源水中病毒;采用非序列依赖性单引物扩增技术(sequence independent single primer amplification,SISPA)[14]扩增未知的核苷酸序列,使得未知微量基因序列的有效测序成为可能[15];采用新一代测序技术对获得RNA病毒[16]、DNA病毒的基因序列进行测序、生物信息学分析,为饮用水生产中病毒多样性的全面快速检测方法的建立打下一定理论基础[17],为水体病毒的多样性研究提供了新的途径[18-21],为饮用水病毒快速检测技术的开发提供一定的参考依据。

1 材料与方法

1.1 材料与处理

研究选取中国东太湖某净水厂源水(N31º0’8.88”,E120º27’21.15”),该净水厂于2013年投入生产,日产饮用水300 000 t,源水水质相对稳定。2014年分别于1月、4月、7月和10月进行采样,每月采样4 次,每次采集源水200 L,研究采用GSC-TFF的方法:将水体先后通过1 μm滤膜进行预过滤,滤液进行0.22 μm TFF,获得滤液经过50 kDa切向流超滤,将浓缩液用蠕动泵循环注入至0.22 μm TFF超滤后获得滤液中,直至获得浓缩液体积约100 mL,后采用超滤管进一步浓缩,流程见图1。

图1 GSC-TFF法分离富集源水中病毒
Fig. 1 Separation and enrichment of virus by GSC-TFF method from source water

1.2 试剂

Innu PREP Virus DNA/RNA Kit 德国Analytik Jena AG公司;AxyPrepDNA凝胶回收试剂盒 美国Axygen公司;Rna EZ Reagents H RNase-Be-Gone for solution applications RT4202 加拿大BIO Basic Canada Inc.公司;M-MuLV一步法RT-PCR试剂盒SK24320 生工生物工程(上海)股份有限公司。

1.3 仪器与设备

SK-15台式高速冷冻离心机 德国Sigma公司;JS-400A恒温金属浴 上海培清科技有限公司;GeneAmp®9700型聚合酶链式反应(polymerase chain reaction,PCR)仪 美国ABI公司;NanoDrop2000超微量分光光度计 美国Thermo Scientific公司;QuantiFluor™-ST蓝色荧光定量系统 美国Promega公司;MiSeq PE250测序仪 美国Illumina公司;Amicon Ultra-15 mL、50 kDa Centrifugal Filter Unit、Pellicon XL 50 cm2切向流超滤 美国Millipore公司。

1.4 方法

1.4.1 源水中DNA病毒、RNA病毒中基因组提取

各采样时间获得浓缩病毒液体分成10 份,每份200 μL,采用DNaseⅠ和RNaseⅠ消解非病毒DNA及RNA片段(浓缩液200 μL,DNaseⅠ10 μL,DNaseⅠbuffer 30 μL,RNase 3 μL,37 ℃孵育90 min,75 ℃孵育10 min),以去除混杂的DNA和RNA,采用Innu PREP Virus DNA/RNA Kit提取病毒DNA和RNA。

1.4.2 RNA病毒基因组RNA反转录、DNA及cDNA的SISPA扩增[22-24]

为保证后续实验的稳定进行,对获取RNA样本进行随机反转录,将1.4.1节中获得RNA 10 μL,FR26RV-N(5’-GCCGGAGCTCTGCAGATATCNNNNNNN-3’)2 μL,FR40RV-T(5’-GCCGGAGCTCTGCAGATATCTT TTTTTTTTTTTTTT-3’)2 μL以RNase free ddH2O定容至12 μL,混匀后离心3~5 s,65 ℃反应5 min,移至冰上,在冰浴中加入以下组分:5×Frist strand buffer 4 μL,RNase Inhibitor(20 U/μL)8 U 1 μL,DTT 4 μL,dNTP(10 mmol/L)2 μL,M-MulV RT(200 U/μL) 1 μL,混匀后离心3~5 s,RNA病毒反转录条件为:25 ℃反应10 min,42 ℃反应50 min,70 ℃反应10 min,转移至冰浴冷却后置于-20 ℃保存。同时进行DNA基因组处理:DNA样本20 μL,1×Ecopol buffer 2.5 μL,dNTP(10 mmol/L)1 μL,FR20RV-N 2 μL,于94 ℃温浴3 min,转移至冰浴冷却后置于-20 ℃保存。分别向上述获得溶液中加入3’-5’ exo klenow DNA polymerase 0.5 μL,37 ℃、60 min。

SISPA扩增反应体系如下:1×GeneAmp PCR buffer 5 μL,MgCl2(12.5 mmol/L)4 μL,dNTP(10 mmol/L)1 μL,R20RV(10 μmol/L)1 μL,AmpliTaq酶(2.5 U/μL)0.25 μL,ddH2O补齐至50 μL;94 ℃预变性10 min,扩增反应程序为94 ℃变性1 min,60 ℃退火1 min,72 ℃延伸2 min进行40 个循环,72 ℃延伸7 min,4 ℃保存,置入-20 ℃保藏。

1.4.3 琼脂糖凝胶电泳鉴定及回收

图2 SISPA产物琼脂糖凝胶电泳图
Fig. 2 Agarose gel electrophoresis of the SISPA products

将全年4 次采样并扩增获得DNA及RNA产物分别混合,采用2%琼脂糖凝胶鉴定,具体为采用1×TAE缓冲溶液、DNA Marker Plus、65 V,70 min,见图2。采用AxyPrep DNA kit试剂盒回收150~1 500 bp片段。

1.4.4 源水中病毒基因组测序质控、分析及组装

采用Covaris M220对获得基因组片段化,片段化后DNA长度小于400 bp,构建文库(DNA片段两端链接接头,琼脂糖凝胶电泳筛选片段,保留AB接头完整片段,氢氧化钠变性,获得单链DNA),桥式PCR,Illumina Miseq测序,基因测序委托上海美吉生物医药科技有限公司进行,DNA序列测序、拼接、质控由该公司协助完成。测序结果表明基因组测序质量较好,具有研究意义,对原始测序数据进行质控,剪切adapter,修剪低质量reads末端和含N比例较高的reads(>10%),去除小片段。

1.4.5 源水中病毒基因组比对方法

宏基因组测序获得reads经质检、筛选、拼接后与美国国家生物信息中心(National Center for Biotechnology Information,NCBI)病毒库(https://www.ncbi.nlm.nih.gov/genomes/GenomesGroup.cgi?taxid=10239)进行分析比对[25],在BLAST比对过程中参数设置期望值e-value设置为1×10-5,而未采用在病毒基因比对过程中常用的1×10-3水平,提高了对基因相似程度的要求,虽减少了比对出病毒的分类数量,抛弃了因病毒变异导致的大规模基因差异,但同时提高了对病毒基因比对存在性的可能,对病毒多样性研究更具有实际的意义。

2 结果与分析

2.1 测序结果及数据初步分析

表1 源水病毒基因组测序数据统计
Table 1 Statistics of viral genome sequences in source water

经1.4.4节质控后测序共获得基因组1 190 914 928 bp,测序数据统计见表1所示。将获得基因序列进行组装,对trim后的数据采用Errorcorrection校正,对校正后的序列merge,并基于overlap关系进行拼接,拼接后的数据采用GS De Novo Assembler v2.8软件进行处理[26]。组装后获得5 554 条scaffolds(框架序列),在所有scaffolds中的碱基共3 900 026 bp,超过1 000 bp的长scaffolds序列共445 条,最长的基因碱基长度5 386 bp。其中scaffold N50的长度为1 177 bp、scaffold N90的长度为1 023 bp,这表明采用该方法获得的病毒基因组的基因序列信息优于此前Kyle Bibby对污泥中病毒基因组的测序获得病毒基因组信息[27]

2.2 饮用水源水中病毒基因组COG、KOG功能分析

将测序获得reads采用Barrnap 0.4.2和tRNAscan-SE v1.3.1软件对基因组中包含的rRNA和tRNA进行预测,利用Glimmer 3.02(http://www.cbcb.umd.edu/software/glimmer/)软件进行病毒的基因预测,共识别出368 个orf,平均长度为697 bp,与string数据库(V9.05版)进行BLASTP(BLAST 2.2.28+)比对,进行COG功能分析,见图3。

图3 源水病毒基因组COG功能分析
Fig. 3 COG functional analysis of viral genome in source water

图3表明,Unigenes可划分为16 个功能组,大部分功能均为可知,较多的COG功能分类组集中在氨基酸运输和代谢、复制、重组和修复、翻译后修饰、蛋白折叠和分子伴侣等功能,这些功能均与病毒体在宿主细胞内的复制、繁殖相关,而部分功能则与病毒侵入细胞膜、胞内运输、基因防御有关,却不具备核结构、染色体结构、胞外骨架、核糖核酸修饰等原核和真核微生物基因所拥有的功能,研究获得病毒的基因组无其他微生物基因掺杂,具有可信性。同时进行KOG功能分类,图4结果显示,预测基因仅具有翻译后修饰、蛋白折叠和分子伴侣,相较之下,病毒基因功能预测中Unigenes数量相较原核微生物和真核微生物少的多,且其功能相较简单。这些功能多介入宿主细胞的调控、宿主细胞过程和调控、控制细胞的代谢。

图4 源水病毒基因组KOG功能分类
Fig. 4 KOG functional classification of viral genome in source water

2.3 饮用水源水中病毒基因KEGG通路分析

测序获得病毒基因组与KEGG(http://www.genome.jp/kegg/)数据库[28]运用BLAST算法(blastx/blastp 2.2.28+)进行比对,共获得92 个基因,被注释到68 个orf区(open reading frame)中,其中包括与噬菌体相关基因xtmB、obg,与病毒侵入宿主后影响宿主DNA复制相关基因dnaG、mraW、rsmH、parA、soj、DPO1、polA等,通过KEEG通路分析可了解病毒基因组功能,难以获得源水中病毒的多样性信息。这些基因可参与到61 个基因通路中,这些基因通路中可能由病毒影响宿主发生相应变化的有:错配修复、同源重组、细胞周期、碱基切除修复、DNA复制、代谢途径、RNA降解等,其中与代谢途径相关的基因功能片段最多共26个orf区。

2.4 饮用水源水中病毒多样性分析

获得的病毒基因组测序reads用1.4.5节中所述方法进行比对,经过比对按照国际病毒分类委员会的分类方法[29],在目的水平上分为:有尾噬菌体目(Caudovirales)、疱疹病毒目(Herpesvirales)、线状病毒目(Ligamenvirales),未定义到剩余四个目:单股反链病毒目(Mononegavirales)、网巢病毒(Nidovirales)、小核糖核酸病毒(Picornavirales)和芜菁黄花叶病毒目(Tymovirales),剩余的scaffolds序列被定义为norank,这说明在源水中病毒的分类较为丰富。

在科的水平上,宏基因组测序获得基因序列经过比对可注释到40 个科病毒的同源序列,其中含量最高的病毒科为Microviridae占27.590 1%,Siphoviridae占23.010 7%,Phycodnaviridae占5.322 2%,Podoviridae占4.884 5%,Retroviridae占1.691 2%,Mimiviridae占1.960 8%,norank占21.572 8%,表明有102 112 条reads在科水平上无法分类(norank),见图5。

图5 源水科水平主要病毒多样性及丰度
Fig. 5 Diversity and abundance of viruses in source water at the family level

在比对出的4 0 个科的病毒涵盖了动物病毒(Baculoviridae、Asfarviridae、Iridoviridae等)、植物病毒(Potyviridae、Caulimoviridae、Geminiviridae等)、古菌病毒(Lipothrixviridae)、藻类病毒(Phycodnaviridae)、噬菌体(Myoviridae、Rudiviridae)、逆转录病毒(Retroviridae)等,从遗传物质结构来看在比对结果中存在DNA病毒(Herpesviridae、Alloherpesviridae、Adenoviridae、Poxviridae等)、RNA病毒(Reoviridae、Retroviridae、Orthomyxoviridae等)、噬菌体(Myoviridae、Inoviridae等),此外,从遗传物质的链型来看,存在ssDNA病毒、dsDNA病毒、线状DNA病毒、环状DNA病毒、环状单链DNA病毒、dsRNA病毒、ssRNA病毒、线状RNA病毒、环状RNA病毒等,验证了将RNA病毒中RNA反转录后与DNA病毒DNA一同进行SISPA的可行性,同时说明了在源水中病毒的多样性,采用病毒宏基因组测序的方法结合RNA病毒反转录和与DNA病毒的DNA序列一同进行SISPA可有效探知环境(水体)中RNA病毒和DNA病毒的多样性,破解了病毒高通量检测的难题。

从病毒的致病性来看,比对出的40 个科的病毒中含有大量致病性的病毒,包括鱼贝类致病病毒(Malacoherpesviridae、Alloherpesviridae)、猪致病病毒(Asfarviridae,流行病学调查以前未出现于亚洲)[30-31]、无脊椎动物病毒(Iridoviridae、Baculoviridae等)、植物致病病毒(Caulimoviridae、Geminiviridae等)、人及动物病毒(Flaviviridae、Reoviridae、Retroviridae等)、藻类病毒(Phycodnaviridae)等,这些病毒菌具有较强的致病性,且其中部分病毒、可导致人体肿瘤、癌症,采用宏基因组测序的方法可以将各类病毒一次检测,具有高通量的特点。

3 结 论

在饮用水生产中病毒的主要来源可能为源水,源水中病毒滴度低,难以富集,采用GSC-TFF法富集源水中病毒,源水浓缩效果好,源水中病毒经过基因组提取,RNA病毒反转录后与DNA病毒基因一起进行SISPA扩增,扩增产物长度较长而进行片段化后,采用Illumina Miseq病毒基因组测序,结果表明:1)饮用水源水中含有大量病毒,KEEG分析及病毒基因预测发现基因组中含有基因功能与病毒侵入细胞进行复制繁殖等相关,不具备核结构、染色体结构,表明研究采用浓缩方法可以很好剔除非病毒微生物,为后期研究提供参考依据;2)病毒基因组COG和KOG分析表明,病毒基因组中存在病毒相关功能基因,但如仅采用基因组功能分析,难以揭示环境中(源水)病毒的丰度和多样性;3)因病毒基因中不具有高度保守性和特异性的序列,多样性分析困难,病毒变异速度快,将病毒基因组与NCBI中病毒基因数据库直接进行BLAST是病毒多样性分析中有效的方法,通过比对获得源水中病毒多样性的信息,以及致病性较强的病毒信息,为后期的病毒的分子生物学快速检测奠定基础,研究在源水中获得3 个病毒目、40 个病毒科、119 个病毒属的多样性信息,获知源水中病毒多态性,可以此为基础开发水体病毒的快速检测技术,应用于饮用水生产中病毒的快速检测。

参考文献:

[1] FUHRMAN J A. Microbial community structure and its functional implications[J]. Nature, 2009, 459: 193-199. DOI:10.1038/nature08058.

[2] KOONIN E V, SENKEVICH T G, DOLJA V V. The ancient virus world and evolution of cells[J]. Biology Direct, 2006, 1(1): 29.DOI:10.1186/1745-6150-1-29.

[3] ZHOU Y, FERNANDEZ S, YOON I, et al. Metagenomics study of viral pathogens in undiagnosed respiratory specimens and identification of human enteroviruses at a Thailand hospital[J]. The American Journal of Tropical Medicine and Hygiene, 2016, 95(3):663-669. DOI:10.1186/1745-6150-1-29.

[4] GOYAL S M C J L. Viruses in foods[M]. Switzerland: Springer International Publishing, 2016: 5-42.

[5] DALZIEL A E, DELEAN S, HEINRICH S, et al. Persistence of low pathogenic influenza a virus in water: a systematic review and quantitative meta-analysis[J]. PLoS ONE, 2016, 11(10): e016878912.DOI:10.1371/journal.pone.0168789.

[6] DALZIEL A E, DELEAN S, HEINRICH S, et al. Correction:persistence of low pathogenic influenza a virus in water: a systematic review and quantitative meta-analysis[J]. PLoS ONE, 2016, 11(12):e168789. DOI:10.1371/journal.pone.0168789.

[7] PREVOST B, GOULET M, LUCAS F S, et al. Viral persistence in surface and drinking water: suitability of PCR pre-treatment with intercalating dyes[J]. Water Research, 2016, 91: 68-76. DOI:10.1016/j.watres.2015.12.049.

[8] ROHWER F, EDWARDS R. The phage proteomic tree: a genomebased taxonomy for phage[J]. Journal of Bacteriology, 2002, 184(16):4529-4535. DOI:10.1016/j.watres.2015.12.049.

[9] YU D, HAN L, ZHANG L, et al. Diversity and distribution characteristics of viruses in soils of a marine-terrestrial ecotone in East China[J]. Microbial Ecology, 2017, 74(263): 1-12. DOI:10.1007/s00248-017-1049-0.

[10] HUNTER P. Viral taxonomy: the effect of metagenomics on understanding the diversity and evolution of viruses[J]. EMBO Reports, 2017, 18(10): 1673-1870. DOI:10.15252/embr.201744982.

[11] 张云, 刘燕, 张强, 等. 饮用水标准中病毒指标应用现状及研究进展[J].中国公共卫生, 2010(5): 540-542.

[12] SANGSANONT J, DANG T D, TRAN T V N, et al. Detection of pepper mild mottle virus as an indicator for drinking water quality in Hanoi, Vietnam, in large volume of water after household treatment[J].Journal of Environmental Science and Health Part A-Toxic/Hazardous Substances & Environmental Engineering, 2016, 51(13): 1100-1106.DOI:10.1080/10934529.2016.1199650.

[13] SARMA M P, AHMED G, MEDHI S, et al. Hepatitis B virus genome analysis in patients of hepatocellular carcinoma and asymptomatic carriers from northern, southern and North East India[J]. Current Science, 2016, 111(4): 648-661. DOI:10.18520/cs/v111/i4/648-661.

[14] CHRZASTEK K, LEE D, SMITH D, et al. Use of sequenceindependent, single-primer-amplification (SISPA) for rapid detection,identification, and characterization of avian RNA viruses[J]. Virology,2017, 509: 159-166. DOI:10.1016/j.virol.2017.06.019.

[15] DJIKENG A, HALPIN R, KUZMICKAS R, et al. Viral genome sequencing by random priming methods[J]. BMC Genomics, 2008,9(1): 5. DOI:10.1186/1471-2164-9-5.

[16] DJIKENG A, KUZMICKAS R, ANDERSON N G, et al. Metagenomic analysis of RNA viruses in a fresh water lake[J]. PLoS ONE, 2009,4(9): e72649. DOI:10.1371/journal.pone.0007264.

[17] HALL R J, WANG J, TODD A K, et al. Evaluation of rapid and simple techniques for the enrichment of viruses prior to metagenomic virus discovery[J]. Journal of Virological Methods, 2014, 195: 194-204. DOI:10.1016/j.jviromet.2013.08.035.

[18] 夏骏, 汪岷, 宫政, 等. 以宏基因组技术探讨渤海秋冬季节病毒多样性[J]. 海洋与湖沼, 2016, 47(3): 572-580. DOI:10.11693/hyhz20151100293.

[19] ROSARIO K, NILSSON C, LIM Y W, et al. Metagenomic analysis of viruses in reclaimed water[J]. Environmental Microbiology, 2009,11(11): 2806-2820. DOI:10.1111/j.1462-2920.2009.01964.x.

[20] POPGEORGIEV N, TEMMAM S, RAOULT D, et al. Describing the silent human virome with an emphasis on giant viruses[J].Intervirology, 2013, 56(6): 395-412. DOI:10.1159/000354561.

[21] COLSON P, FANCELLO L, GIMENEZ G, et al. Evidence of the megavirome in humans[J]. Journal of Clinical Virology, 2013, 57(3):191-200. DOI:10.1016/j.jcv.2013.03.018.

[22] YAO S, LI X, ZHAO S, et al. Duck enteritis virus identified in chickens with acute viral infection syndrome using DNAase-SISPA[J].2012 7thInternational Conference on System of Systems Engineering(SOSE), 2012: 797-800. DOI:10.1109/SYSoSE.2012.6333676.

[23] ROSSEEL T, SCHEUCH M, HOEPER D, et al. DNase SISPA-Next generation sequencing confirms schmallenberg virus in belgian field samples and identifies genetic variation in Europe[J]. PLoS ONE,2012, 7(7): e419677. DOI:10.1371/journal.pone.0041967.

[24] MASON P N, BERTOLINI G, LANCEROTTO R. Toothbrushing simulator:technical note[J]. G Stomatol Ortognatodonzia, 1985, 4(1): 71-74.

[25] NORLING M, KARLSSON-LINDSJO O E, GOURLE H, et al.MetLab: an in silico experimental design, simulation and analysis tool for viral metagenomics studies[J]. PLoS ONE, 2016, 11(8):e01603348. DOI:10.1186/1471-2105-12-119.

[26] KUMAR S, BLAXTER M L. Comparing de novo assemblers for 454 transcriptome data[J]. BMC Genomics, 2010, 11(1): 571.DOI:10.1186/1471-2164-11-571.

[27] VIAU E, BIBBY K, PAEZ-RUBIO T, et al. Toward a consensus view on the infectious risks associated with land application of Sewage Sludge[J]. Environmental Science & Technology, 2011, 45(13):5459-5469. DOI:10.1021/es200566f.

[28] DU J L, YUAN Z F, MA Z W, et al. KEGG-PATH: Kyoto encyclopedia of genes and genomes-based pathway analysis using a path analysis model[J]. Molecular Biosystems, 2014, 10(9): 2441-2447. DOI:10.1039/C4MB00287C.

[29] ADRIAENSSENS E M, KRUPOVIC M, KNEZEVIC P, et al.Taxonomy of prokaryotic viruses: 2016 update from the ICTV bacterial and archaeal viruses subcommittee[J]. Archives of Virology,2017, 162(4): 1153-1157. DOI:10.1007/s00705-016-3173-4.

[30] BAJRAI L H, BENAMAR S, AZHAR E I, et al. Kaumoebavirus,a new virus that clusters with Asfarviridae and Faustoviruses[J].Viruses-Basel, 2016, 8(11): 278. DOI:10.3390/v8110278.

[31] ANDREANI J, BOU KHALIL J Y, SEVVANA M, et al. Pacmanvirus,a new giant icosahedral virus at the crossroads between Asfarviridae and Faustoviruses[J]. Journal of virology, 2017, 91(22): 12-17.DOI:10.1128/JVI.00212-17.

Analysis of Virus Diversity in Drinking Source Water by Using Illumina MiSeq Sequencing Technology

GE Yingliang1,2, YU Shuili2,3,*, SHI Wenxin2,*
(1. School of Food Engineering, Harbin University, Harbin 150080, China;2. School of Municipal and Environmental Engineering, Harbin Institute of Technology, Harbin 150090, China;3. College of Environmental Science and Engineering, Tongji University, Shanghai 200092, China)

Abstract:The viruses in drinking source water from east Tai Lake were separated and concentrated by gradient-series connection-circulation-tangential flow ultrafiltration (GSC-TFF). The viral genome was amplified by sequence independent single primer amplification (SISPA), sequenced by Illumina Miseq, and compared with the NCBI gene database using the basic local alignment search tool (BLAST). After quality control, 1 190 914 928 bp gene data were obtained, which could be assembled into 5 554 scaffold sequences. Viral genome function was found and annotated to Caudovirales, Herpesvirales and Ligamenvirales at the family level. A total of 40 families of homologous sequences were annotated, Microviridae (27.590 1%),Siphoviridae (23.010 7%), Phycodnaviridae (5.322 2%), Retroviridae (1.691 2%), Mimiviridae (1.960 8%) being the dominant ones. A total of 102 112 reads (21.572 8%) were identified as no rank at the family level. The approach proposed in this study can allow high throughput analysis of virus diversity in source water, paving the foundation for detecting virus in water.

Keywords:Illumina Miseq sequencing; drinking source water; virus; diversity

DOI:10.7506/spkx1002-6630-201802045

中图分类号:Q939.9

文献标志码:A

文章编号:1002-6630(2018)02-0287-06

引文格式:葛英亮, 于水利, 时文歆. 应用Illumina Miseq测序分析饮用水源水中病毒多样性[J]. 食品科学, 2018, 39(2): 287-292.

DOI:10.7506/spkx1002-6630-201802045. http://www.spkx.net.cn

GE Yingliang, YU Shuili, SHI Wenxin. Analysis of virus diversity in drinking source water by using Illumina Miseq sequencing technology[J]. Food Science, 2018, 39(2): 287-292. (in Chinese with English abstract)

DOI:10.7506/spkx1002-6630-201802045. http://www.spkx.net.cn

收稿日期:2017-07-15

基金项目:“十二五”国家科技重大专项(2012ZX07403-001)

第一作者简介:葛英亮(1979—),男,副教授,博士研究生,研究方向为食品生物技术、饮用水生物安全。E-mail:geyingliang@126.com

*通信作者简介:于水利(1962—),男,教授,博士,研究方向为膜处理工艺、饮用水安全技术。E-mail:yushuiligd@126.com

时文歆(1970—),男,教授,博士,研究方向为膜分离技术、饮用水安全技术。E-mail:shiwx_hit@163.com